没有合适的资源?快使用搜索试试~ 我知道了~
决策树汇报专用 手动推演 代码大全
需积分: 5 0 下载量 7 浏览量
2022-10-18
17:02:14
上传
评论
收藏 6.12MB PPTX 举报
温馨提示
试读
26页
决策树汇报专用 手动推演 代码大全决策树汇报专用 决策树汇报专用 手动推演 代码大全决策树汇报专用 手动推演 代码大全决策树汇报专用 手动推演 代码大全手动推演 代码大全
资源推荐
资源详情
资源评论
第 页
自强·笃行
决策树定义及背景
1
决策树算法是一种逼近离散函数值的方法。它是一种
典型的分类方法,首先对数据进行处理,利用归纳算法生
成可读的规则和决策树,然后使用决策对新数据进行分
析。本质上决策树是通过一系列规则对数据进行分类的过
程。
决策树的典型算法:有ID3、C4.5、CART等;
决策树算法的优点:分类精度高;生成的模式简单;对
噪声数据有很好的健壮性。因而是目前应用最为广泛的归
纳推理算法之一,在数据挖掘中受到研究者的广泛关注。
第 页
自强·笃行
基本思想
2
决策树来发现数据中蕴涵的分类规则。如何构造精度
高、规模小的决策树是决策树算法的核心内容。决策树构
造可以分两步进行。第一步,决策树的生成:由训练样本
集生成决策树的过程。一般情况下,训练样本数据集是根
据实际需要有历史的、有一定综合程度的,用于数据分析
处理的数据集。第二步,决策树的剪技:决策树的剪枝是
对上一阶段生成的决策树进行检验、校正和修下的过程,
主要是用新的样本数扼集(称为测试数据集)中的数据校
验决策树生成过程中产生的初步规则。
第 页
自强·笃行
构造方法
3
决策树构造的输入是一组带有类别标记的例子,构造的结果是一棵
二叉树或多叉树。二叉树的内部节点(非叶子节点)一般表示为一个逻辑
判断,如形式为a=j的逻辑判断,其中a是属性,aj是该属性的所有取值:
树的边是逻辑判断的分支结果。多叉树(ID3)的内部结点是属性,边是该
属性的所有取值,有几个属性值就有几条边。树的叶子节点都是类别标
记。
由于数据表示不当、有噪声或者由于决策树生成时产生重复的子树
等原因,都会造成产生的决策树过大。因此,简化决策树是一个不可缺
少的环节。寻找一棵最优决策树,主要应解决以下3个最优化问题:①生
成最少数目的叶子节点;②生成的每个叶子节点的深度最小;③生成的决
策树叶子节点最少且每个叶子节点的深度最小。
第 页
自强·笃行
三种算法的简述:ID3
4
ID3算法是决策树的一种,它是基于奥卡姆剃刀原理的,即用尽
量用较少的东西做更多的事。ID3算法,即迭代二叉树3代,是
RossQuinlan发明的一种决策树算法,这个算法的基础就是上面提到
的奥卡姆剃刀原理,越是小型的决策树越优于大的决策树,尽管如
此,也不总是生成最小的树型结构,而是一个启发式算法。
在信息论中,期望信息越小,那么信息增益就越大,从而纯度就
越高。
ID3的核心思想是利用信息熵原理选择信息增益最大的属性作为
分类属性,递归地拓展决策树的分枝,完成决策树的构造。
剩余25页未读,继续阅读
资源评论
李逍遥敲代码
- 粉丝: 2999
- 资源: 277
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- java-leetcode题解之第972题最接近原点的K个点.zip
- java-leetcode题解之第347题前K个高频元素.zip
- java-leetcode题解之第215题数组中的第K个最大元素.zip
- java-leetcode题解之第641题设计循环双端队列.zip
- java-leetcode题解之第1284题转化为全零矩阵的最少反转次数.zip
- java-leetcode题解之第1311获取已观看视频.zip
- java-leetcode题解之第621题任务调度器.zip
- java-leetcode题解之第622题设计循环队列.zip
- java-leetcode题解之第51题N皇后.zip
- java-leetcode题解之第283题移动零.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功