decision-tree处理连续值的决策树

共10个文件

xml：3个

txt：2个

py：2个

需积分: 2 3 下载量 148 浏览量 2024-04-07 20:34:22 上传评论收藏 10KB ZIP 举报

温馨提示

decision-tree 处理连续值的决策树数据集 traindata.txt为训练数据集，testdata.txt为测试数据集，数据有4个特征，一共有3个label。实验原理采用ID3算法，即在每次需要分裂时，计算每个属性的增益率，然后选择增益率最大的属性进行分裂。对于特征属性为连续值，可以如此使用ID3算法：先将D中元素按照特征属性排序，则每两个相邻元素的中间点可以看做潜在分裂点，从第一个潜在分裂点开始，分裂D并计算两个集合的期望信息，具有最小期望信息的点称为这个属性的最佳分裂点，其信息期望作为此属性的信息期望。代码介绍生成决策树： decisiontree.py 绘制决策树： treePlotter.py

资源推荐

资源详情

资源评论

收起资源包目录

decision-tree-master.zip （10个子文件）

decision-tree-master

traindata.txt 1KB

treePlotter.py 6KB

decisiontree.py 11KB

.idea

misc.xml 302B

inspectionProfiles

profiles_settings.xml 174B

modules.xml 278B

.gitignore 38B

decision-tree.iml 398B

testdata.txt 1KB

README.md 785B

共 10 条

# decision-tree 处理连续值的决策树 ## 数据集 traindata.txt为训练数据集，testdata.txt为测试数据集，数据有4个特征，一共有3个label。 ## 实验原理采用ID3算法，即在每次需要分裂时，计算每个属性的增益率，然后选择增益率最大的属性进行分裂。对于特征属性为连续值，可以如此使用ID3算法：先将D中元素按照特征属性排序，则每两个相邻元素的中间点可以看做潜在分裂点，从第一个潜在分裂点开始，分裂D并计算两个集合的期望信息，具有最小期望信息的点称为这个属性的最佳分裂点，其信息期望作为此属性的信息期望。 ## 代码介绍生成决策树： decisiontree.py 绘制决策树： treePlotter.py

评论收藏

内容反馈

资源评论