┊
┊
┊
┊
┊
┊
┊
┊
┊
┊
┊
┊
┊
装
┊
┊
┊
┊
┊
订
┊
┊
┊
┊
┊
线
┊
┊
┊
┊
┊
┊
┊
┊
┊
┊
┊
┊
┊
决策树算法对 UCI wine 数据集分类的实现
1 功能实现与样本分析
在数据挖掘领域,可以利用相应的算法对数据集进行训练,即对样本的特征进行分析,从而
归纳出相同类别的样本之间存在的内在特征联系,进一步对未知类别的样本进行预测,判断出该
样本所属的类别。本文实现了利用决策树算法对 UCI 机器学习库上的经典 wine 数据集进行分类
的目的。
为达到相应的分类目的,需要先对数据集样本进行分析。
表 1 wine 数据集样本特征
不用化学成分的含量与酒的所属类别息息相关。表 1 列举了所选用的 wine 数据集的特征情
况。整个数据集样本包含 13 个特征,例如 Alcohol(酒精度),Malic acid(苹果酸含量)等,这些
特征的取值范围见表 1 所示。
表 2 wine 数据集部分样本表
酒的品种可能属于 3 种类别。表 2 展示了 wine 数据集的部分样本情况。所以,本文的目的
就是运用分类算法,挑选相应的特征属性来构造相应的决策树,挖掘 wine 数据集类别与 13 个特
征之间的关系。并利用所构造的决策树来对测试样本做预测,分析预测误差,从而证明所构造的
评论0
最新资源