没有合适的资源?快使用搜索试试~ 我知道了~
大数据决策树算法数据挖掘分类算法之决策树
5星 · 超过95%的资源 需积分: 29 4 下载量 126 浏览量
2023-01-15
16:52:12
上传
评论
收藏 1.2MB PPTX 举报
温馨提示
试读
75页
1、Hunt,Marin和Stone 于1966年研制的CLS学习系统,用于学习单个概 念。 2、1979年, J.R. Quinlan 给出ID3算法,并在1983年和1986年对ID3 进行了总结和简化,使其成为决策树学习算法的典型。 3、Schlimmer 和Fisher 于1986年对ID3进行改造,在每个可能的决策树节点创建缓冲区,使决策树可以递增式生成,得到ID4算法。 4、1988年,Utgoff 在ID4基础上提出了ID5学习算法,进一步提高了效率。 1993年,Quinlan 进一步发展了ID3算法,改进成C4.5算法。 5、另一类决策树算法为CART,与C4.5不同的是,CART的决策树由二元逻辑问题生成,每个树节点只有两个分枝,分别包括学习实例的正例与反例。 假定公司收集了左表数据,那么对于任意给定的客人(测试样例),你能帮助公司将这位客人归类吗? 即:你能预测这位客人是属于“买”计算机的那一类,还是属于“不买”计算机的那一类? 又:你需要多少有关这位客人的信息才能回答这个问题? 决策树中最上面的结点称为根结点。 是整个决策树的开始。每个分支是一 个新的决策
资源推荐
资源详情
资源评论
数据挖掘分类算法之决策树
主要内容
认识决策树
过拟合问题
CLS算法
ID3算法
C4.5 算法
CART 算法
认识决策树
与决策树相关的重要算法
1、Hunt,Marin和Stone于1966年研制的CLS学习系统,用于学习单个概
念。
2、1979年,J.R.Quinlan给出ID3算法,并在1983年和1986年对ID3进行
了总结和简化,使其成为决策树学习算法的典型。
3、Schlimmer和Fisher于1986年对ID3进行改造,在每个可能的决策树
节点创建缓冲区,使决策树可以递增式生成,得到ID4算法。
4、1988年,Utgoff在ID4基础上提出了ID5学习算法,进一步提高了效
率。
1993年,Quinlan进一步发展了ID3算法,改进成C4.5算法。
5、另一类决策树算法为CART,与C4.5不同的是,CART的决策树由二
元逻辑问题生成,每个树节点只有两个分枝,分别包括学习实例的正
例与反例。
CLS, ID3,C4.5,CART
计
数
年龄 收入 学生 信誉 归类:买计算机
?
64
青 高 否 良 不买
64
青 高 否 优 不买
128
中 高 否 良 买
60
老 中 否 良 买
64
老 低 是 良 买
64
老 低 是 优 不买
64
中 低 是 优 买
128
青 中 否 良 不买
64
青 低 是 良 买
132
老 中 是 良 买
64
青 中 是 优 买
32
中 中 否 优 买
32
中 高 是 良 买
63
老 中 否 优 不买
1
老 中 否 优 买
假定公司收集了左表数据,那么对
于任意给定的客人(测试样例),
你能帮助公司将这位客人归类吗?
即:你能预测这位客人是属于“买”
计算机的那一类,还是属于“不买”
计算机的那一类?
又:你需要多少有关这位客人的信
息才能回答这个问题?
决策树的用途
认识决策树
计
数
年龄 收入 学生 信誉 归类:买计算机
?
64
青 高 否 良 不买
64
青 高 否 优 不买
128
中 高 否 良 买
60
老 中 否 良 买
64
老 低 是 良 买
64
老 低 是 优 不买
64
中 低 是 优 买
128
青 中 否 良 不买
64
青 低 是 良 买
132
老 中 是 良 买
64
青 中 是 优 买
32
中 中 否 优 买
32
中 高 是 良 买
63
老 中 否 优 不买
1
老 中 否 优 买
谁在买计算机?
年龄?
学生? 信誉?
买
青
中
老
否
是
优 良
不买
买
买
不买
决策树的用途
认识决策树
剩余74页未读,继续阅读
松鼠协会总动员
- 粉丝: 256
- 资源: 180
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页