一、实验目的
使用数据挖掘中的分类算法,对数据集进行分
类训练并测试。应用不同的分类算法,比较他们
之间的不同。与此同时了解 Weka 平台的基本功
能与使用方法。
二、实验环境
实验采用 Weka 平台,数据使用 Weka 安装目
录下 data 文件夹下的默认数据集 iris.arff。
Weka 是怀卡托智能分析系统的缩写,该系统
由新西兰怀卡托大学开发。Weka 使用 Java 写成
的,并且限制在 GNU 通用公共证书的条件下发
布。它可以运行于几乎所有操作平台,是一款免
费的,非商业化的机器学习以及数据挖掘软
件。Weka 提供了一个统一界面, 可结合预处理
以及后处理方法,将许多不同的学习算法应用
于任何所给的数据集,并评估由不同的学习方
案所得出的结果。
三、数据预处理
Weka 平台支持 ARFF 格式和 CSV 格式的数据。
由于本次使用平台自带的 ARFF 格式数据,所
以不存在格式转换的过程。实验所用的 ARFF
格式数据集如图 1 所示