# decision-tree
处理连续值的决策树
## 数据集
traindata.txt为训练数据集,testdata.txt为测试数据集,数据有4个特征,一共有3个label。
## 实验原理
采用ID3算法,即在每次需要分裂时,计算每个属性的增益率,然后选择增益率最大的属性进行分裂。
对于特征属性为连续值,可以如此使用ID3算法:先将D中元素按照特征属性排序,则每两个相邻元素的中间点可以看做潜在分裂点,
从第一个潜在分裂点开始,分裂D并计算两个集合的期望信息,具有最小期望信息的点称为这个属性的最佳分裂点,其信息期望作为此属性的信息期望。
## 代码介绍
生成决策树:
decisiontree.py
绘制决策树:
treePlotter.py
没有合适的资源?快使用搜索试试~ 我知道了~
decision-tree处理连续值的决策树
共10个文件
xml:3个
txt:2个
py:2个
需积分: 2 3 下载量 148 浏览量
2024-04-07
20:34:22
上传
评论
收藏 10KB ZIP 举报
温馨提示
decision-tree 处理连续值的决策树 数据集 traindata.txt为训练数据集,testdata.txt为测试数据集,数据有4个特征,一共有3个label。 实验原理 采用ID3算法,即在每次需要分裂时,计算每个属性的增益率,然后选择增益率最大的属性进行分裂。 对于特征属性为连续值,可以如此使用ID3算法:先将D中元素按照特征属性排序,则每两个相邻元素的中间点可以看做潜在分裂点, 从第一个潜在分裂点开始,分裂D并计算两个集合的期望信息,具有最小期望信息的点称为这个属性的最佳分裂点,其信息期望作为此属性的信息期望。 代码介绍 生成决策树: decisiontree.py 绘制决策树: treePlotter.py
资源推荐
资源详情
资源评论
收起资源包目录
decision-tree-master.zip (10个子文件)
decision-tree-master
traindata.txt 1KB
treePlotter.py 6KB
decisiontree.py 11KB
.idea
misc.xml 302B
inspectionProfiles
profiles_settings.xml 174B
modules.xml 278B
.gitignore 38B
decision-tree.iml 398B
testdata.txt 1KB
README.md 785B
共 10 条
- 1
资源评论
进击的代码家
- 粉丝: 2203
- 资源: 204
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功