书 P245—6.11
下表由雇员数据库的训练数据组成,数据已泛化。对于给定的行,count 表示 department、status、age 和 salary
在该行上具有给定值的元组数。设 status 是类标号属性。
(1) 根据 ID3 信息增益属性选择算法构造给定数据的决策树。(10 分)
方法一:对数据预处理,用 weka->explorer->classify(classifier: choose Trees->ID3)自动生成;
1. 首先对数据进行预处理,在 excel 表格中输入数据,并依据 count 将所有元组展开还原(见附件
Book2.xls),另保存为 Book2.csv 文件。然后用 weka->application->explorer->Open file,选择文件类
型为 csv,然后找到 Book2.csv 的存放路径,打开。
- 1
- 2
- 3
- 4
前往页