没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
8页
一、实验目的 1.理解决策树的模型原理; 2.掌握如何实现决策树算法,并用其完成预测。 二、实验原理 决策树,信息熵,信息增益。 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy =系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。 1、决策树的算法原理 (1)找到划分数据的特征,作为决策点 (2)利用找到的特征对数据进行划分成n个数据子集。 (3)如果同一个子集中的数据属于同一类型就不再划分,如果不属于同一类型,继续利用特征进行划分。 (4)指导每一个子集的数据属于同一类型停止划分。 本次实验任务我们使用贷款申请样本数据表,该数据表中每列数据分别代表ID、年龄、高薪、有房、信贷情况、类别,我们根据如下数据使用代码来生成决策树
资源推荐
资源详情
资源评论
实验 Python 机器学习 - 决策树 1
一、实验目的
1.理解决策树的模型原理;
2.掌握如何实现决策树算法,并用其完成预测。
二、实验原理
决策树,信息熵,信息增益。
决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决
策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的
决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形
很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代
表的是对象属性与对象值之间的一种映射关系。Entropy =系统的凌乱程度,使
用算法 ID3, C4.5 和 C5.0 生成树算法使用熵。这一度量是基于信息学理论中熵的
概念。
1、决策树的算法原理
(1)找到划分数据的特征,作为决策点
(2)利用找到的特征对数据进行划分成 n 个数据子集。
(3)如果同一个子集中的数据属于同一类型就不再划分,如果不属于同一
类型,继续利用特征进行划分。
(4)指导每一个子集的数据属于同一类型停止划分。
2、决策树的优点:计算复杂度不高,输出结果易于理解,对中间值的缺失
资源评论
小嘤嘤怪学
- 粉丝: 1510
- 资源: 21
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 论文(最终)_20240430235101.pdf
- 基于python编写的Keras深度学习框架开发,利用卷积神经网络CNN,快速识别图片并进行分类
- 最全空间计量实证方法(空间杜宾模型和检验以及结果解释文档).txt
- 5uonly.apk
- 蓝桥杯Python组的历年真题
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 前端开发技术实验报告:内含4四实验&实验报告
- Highlight Plus v20.0.1
- 林周瑜-论文.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功