没有合适的资源?快使用搜索试试~ 我知道了~
1.ID3、C4.5、CART、SLIQ算法介绍
需积分: 1 2 下载量 89 浏览量
2023-01-15
16:59:00
上传
评论 1
收藏 128KB DOCX 举报
温馨提示
试读
14页
ID3 算法 ID3 算法以信息增益作为分裂属性的选择标准,选择具有最高信息增益的属性最为最佳分裂属性,这样熵减少的程度最大,使得当前划分后得到的数据集再次划分的时候所需要的信息最小。 举例说明 有房 婚姻状况 是否拖欠贷款 是 单身 否 否 已婚 否 否 单身 否 是 已婚 否 否 离异 是 否 已婚 否 是 离异 否 否 单身 是 否 已婚 否 否 单身 是 整个数据集D有3个是,7个否,其信息量(熵)为: I=Info(3,7)=-3/10*-7/10*=0.8813 假设现在来看有房情况这个属性,那么按照它划分后的信息增益计算如下: 有房 无房 是 0 3 否 3 4 =3/10*Info(0,3)+7/10*Info(3,4)=0.690 =I-=0.8813-0.690=0.1913 同理婚姻状况这个属性: 离异 已婚 单身 是 1 0 2 否 1 4 2 =2/10*Info(1,1)+4/10*Info(0,4)+4/10*Info(2,2)=0.6 =I-=0.8813-0.6=0.2213 >,故选取婚姻状况作为根节点进行分裂
资源推荐
资源详情
资源评论
1.ID3、C4.5、CART、SLIQ 算法介绍
ID3 算法
ID3 算法以信息增益作为分裂属性的选择标准,选择具有最高信息增益的属
性最为最佳分裂属性,这样熵减少的程度最大,使得当前划分后得到的数据集再
次划分的时候所需要的信息最小。
➢ 举例说明
整个数据集 D 有 3 个是,7 个否,其信息量(熵)为:
I=Info(3,7)=-3/10*
10/3log
2
-7/10*
10/7log
2
=0.8813
假设现在来看有房情况这个属性,那么按照它划分后的信息增益计算如下:
有房
无房
是
0
3
有房
婚姻状况
是否拖欠贷款
是
单身
否
否
已婚
否
否
单身
否
是
已婚
否
否
离异
是
否
已婚
否
是
离异
否
否
单身
是
否
已婚
否
否
单身
是
否
3
4
有房情况
I
=3/10*Info(0,3)+7/10*Info(3,4)=0.690
有房情况
G
=I-
有房情况
I
=0.8813-0.690=0.1913
同理婚姻状况这个属性:
离异
已婚
单身
是
1
0
2
否
1
4
2
婚姻状况
I
=2/10*Info(1,1)+4/10*Info(0,4)+4/10*Info(2,2)=0.6
婚姻状况
G
=I-
婚姻状况
I
=0.8813-0.6=0.2213
婚姻状况
G
>
有房情况
G
,故选取婚姻状况作为根节点进行分裂。
C4.5 算法
C4.5 算法在 ID3 基础上有两点改进,一是增加了对连续变量的处理,二是用信
息增益率代替信息增益作为选取分裂节点的判定条件,克服了 ID3 偏向于选择离
散值多的属性的过拟合行为。
有房
婚姻状况
收入(K)
是否拖欠贷款
是
单身
125
否
否
已婚
100
否
否
单身
70
否
是
已婚
120
否
否
离异
95
是
否
已婚
60
否
是
离异
220
否
否
单身
85
是
否
已婚
75
否
否
单身
90
是
对于有房情况,婚姻状况这两个属性,其信息增益率为:
有房情况
GR
=
有房情况
G
/Info(3,7)=0.1913/0.8813=0.2171
婚姻状况
GR
=
婚姻状况
G
/Info(2,4,4)=0.2213/1.5219=0.1454
收入(
K
)
60
70
75
85
90
95
100
120
125
220
65
72
80
87
92
97
110
122
172
<=
>
<=
>
<=
>
<=
>
<=
>
<=
>
<=
>
<=
>
<=
>
是
0
3
0
3
0
3
1
2
2
1
3
0
3
0
3
0
3
0
否
1
6
2
5
3
4
3
4
3
4
3
4
4
3
2
5
6
1
信息增益率
1
GR
2
GR
3
GR
4
GR
5
GR
6
GR
7
GR
8
GR
9
GR
收入状况
GR
=max
i
GR
(i=1,2,...9)
选择信息增益率最大的属性作为根节点进行分裂。
CART
CART 算法采用一种二分递归分割的技术,与基于信息熵的算法不同,
CART 算法对每次样本集的划分计算 GINI 系数,选择 GINI 系数较小的属性进行
分裂。
有房
无房
剩余13页未读,继续阅读
资源评论
松鼠协会总动员
- 粉丝: 257
- 资源: 180
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功