实验二
一、 基本原理
分类算法是解决分类问题的方法,是数据挖掘、机器学习和模式识别中一个重要的研
究领域。分类算法通过对已知类别训练集的分析,从中发现分类规则,以此预测新数
据的类别。分类算法的应用非常广泛,银行中风险评估、客户类别分类、文本检索和
搜索引擎分类、安全领域中的入侵检测以及软件项目中的应用等。
二、 实验目的:
掌握 CART 决策树构建分类模型。
三、 实验内容
对所有窃漏电用户及真诚用户的电量、告警及线损数据和该用户在当天是否窃漏电的标
识,按窃漏电评价指标进行处理并选取其中 291 个样本数据,得到专家样本,使用 CART 决
策树实现分类预测模型。
注意:数据的 80%作为训练样本,剩下的 20%作为测试样本。
四、 实验步骤
1、 对数据进行预处理
2、 把数据随机分为两部分,一部分用于训练,一部分用于测试。
分成 testData 和 trainData 文件 即测试数据和训练数据数据的 80%作为训练样本,
剩下的 20%作为测试样本。
3、 使用 tree 包里的 tree 函数以及训练数据构建 CART 决策树模型,使用 predict 函
数和构建的 CART 决策树模型分别对训练数据和测试数据进行分类。
评论1
最新资源