用java实现的大数据分析 ID3算法
这个例子来源于Quinlan的论文。 假设,有种户外活动。该活动能否正常进行与各种天气因素有关。不同的天气因素组合会产生两种后果,也就是分成2类:能进行活动或不能。我们用P表示该活动可以进行,N表示该活动无法进行。 下表描述样本集合是不同天气因素对该活动的影响。 Attribute class outlook temperature(温度) humidity (湿度) windy(风) Play --------------------------------------------------------- sunny hot high false N sunny hot high true N sunny mild high false N sunny cool normal false P sunny mild normal true P rain mild high false P rain cool normal false P rain cool normal true N rain mild normal false P rain mild high true N overcast hot high false P overcast cool normal true P overcast mild high true P overcast hot normal false P 分析如以上数据可得出如下决策树(横着看) |--outlook --|--rainy --|--windy --|--TRUE --|--NO -- |--FALSE --|--YES -- |--sunny --|--humidity --|--high --|--NO -- |--normal --|--YES -- |--overcast --|--YES --
- 1
- 粉丝: 9
- 资源: 4
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助