本实验的基本内容是通过使用 weka 中的三种常见分类和聚类方法(决策树 J48、KNN
和 k-means)分别在训练数据上训练出分类模型,并使用校验数据对各个模型进行测试和
评价,找出各个模型最优的参数值,并对三个模型进行全面评价比较,得到一个最好的分
类模型以及该模型所有设置的最优参数。最后使用这些参数以及训练集和校验集数据一起
构造出一个最优分类器,并利用该分类器对测试数据进行预测。
(1)打开“data02.xls” 另存为 CSV 类型,得到“data02.csv”。
(2)在 WEKA 中提供了一个“Arff Viewer”模块,打开一个“data02.csv”进行浏览,
然后另存为 ARFF 文件,得到“data02.arff”。
3. 实验过程及结果截图
3.1 决策树分类
用“Explorer”打开数据“data02.arff”,然后切换到“Classify”。点击“Choose”,
选择算法“trees-J48”,再在“Test options”选择“Cross-validation(Flods=10)”,
点击“Start”,开始运行。