没有合适的资源?快使用搜索试试~ 我知道了~
数据挖掘实验2.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 119 浏览量
2022-07-02
01:00:52
上传
评论
收藏 194KB PDF 举报
温馨提示
试读
7页
数据挖掘实验2.pdf数据挖掘实验2.pdf数据挖掘实验2.pdf数据挖掘实验2.pdf数据挖掘实验2.pdf数据挖掘实验2.pdf数据挖掘实验2.pdf数据挖掘实验2.pdf
资源推荐
资源详情
资源评论
实验二:决策树
要求:实现决策树分类算法,在两种不同的数据集上(iris.txt 和 wine.txt)比较算法的性能。
有趣的故事介绍一下决策树。[白话决策树模
型](http://www.52analysis.com/shujuwajue/2441.html)
首先第一个数据集 iris.txt。
iris 数据集记录的是鸢尾植物。Scikit-learn 自带了 iris 数据集。
其中 iris.data 记录的就是它的四个属性:萼片/花瓣的长和宽。一个 150*4 的矩阵。
Iris.target 就是每一行对应的鸢尾植物的种类,一共有三种。
测试结果:
可以看到,本算法的性能大约是,准确率为 0.673333333333。
附录-Python 代码:
import sys
from math import log
import operator
from numpy import mean
def get_labels(train_file):
'''
返回所有数据集 labels(列表)
'''
labels = []
for index,line in enumerate(open(train_file,'rU').readlines()):
label = line.strip().split(',')[-1]
labels.append(label)
return labels
资源评论
若♡
- 粉丝: 6204
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功