没有合适的资源？快使用搜索试试~ 我知道了~

文库首页后端Java决策树_ID3算法.docx

决策树_ID3算法.docx

需积分: 3 0 下载量 142 浏览量 2021-03-03 18:35:55 上传评论收藏 165KB DOCX 举报

温馨提示

试读

13页

ID3源代码

资源详情

资源评论

资源推荐

决策树：

主要有两种算法：ID3 算法和 C4.5 算法。C4.5 算法是对 ID3 算法的改进。

今天主要先讲 ID3 算法，之后会讲 C4.5 算法和随机森林等。

Contents

1. 决策树的基本认识

2. ID3 算法介绍

3. 信息熵与信息增益

4. ID3 算法的 C++实现

1. 决策树的基本认识

决策树是一种依托决策而建立起来的一种树。在机器学习中，决策树是一

种预测模型，代表的是一种对象属性与对象值之间的一种映射关系，每一个节

点代表某个对象，树中的每一个分叉路径代表某个可能的属性值，而每一个叶

子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。决策树

仅有单一输出，如果有多个输出，可以分别建立独立的决策树以处理不同的输

出。接下来讲解 ID3 算法。

2. ID3 算法介绍

ID3 算法是决策树的一种，它是基于奥卡姆剃刀原理的，即用尽量较少的

东西做更多的事。ID3 算法，即 Iterative Dichotomiser 3，迭代二叉树

3 代，（Dichotomiser [daɪ'kɒtəmaɪzə] ）是 Ross Quinlan 发明的一种

决策树算法，这个算法的基础就是上面提到的奥卡姆剃刀原理，越是小型的决

策树越优于大的决策树，尽管如此，也不总是生成最小的树型结构，而是一个

启发式算法。

在信息论中，期望信息越小，那么信息增益就越大，从而纯度就越高。

ID3 算法的核心思想就是以信息增益来度量属性的选择，选择分裂后信息增益

最大的属性进行分裂。该算法采用自顶向下的贪婪搜索遍历可能的决策空间。

3. 信息熵与信息增益

在信息增益中，重要性的衡量标准就是看特征能够为分类系统带来多少信

息，带来的信息越多，该特征越重要。在认识信息增益之前，先来看看信息熵

的定义。

熵这个概念最早起源于物理学，在物理学中是用来度量一个热力学系统的

无序程度，而在信息学里面，熵是对不确定性的度量。在 1948 年，香农引入

了信息熵，将其定义为离散随机事件出现的概率，一个系统越是有序，信息熵

就越低，反之一个系统越是混乱，它的信息熵就越高。所以信息熵可以被认为

是系统有序化程度的一个度量。

假如一个随机变量的取值为，每一种取到的

概率分别是，那么

的熵定义为

意思是一个变量的变化情况可能越多，那么它携带的信息量就越大。

对于分类系统来说，类别是变量，它的取值是，而每

一个类别出现的概率分别是

而这里的就是类别的总数，此时分类系统的熵就可以表示为

以上就是信息熵的定义，接下来介绍信息增益。

信息增益是针对一个一个特征而言的，就是看一个特征，系统有它和没

有它时的信息量各是多少，两者的差值就是这个特征给系统带来的信息量，即

信息增益。

接下来以天气预报的例子来说明。下面是描述天气数据表，学习目标是

play 或者 not play。

剩余12页未读，继续阅读

内容反馈

m0_38091314

粉丝: 0
资源: 7

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

决策树_ID3算法.docx

评论0

最新资源

决策树_ID3算法.docx

评论0

决策树——ID3算法

决策树（ID3算法）

决策树算法ID3

决策树算法之ID3

ID3决策树算法

机器学习--决策树(ID3)算法及案例.docx

机器学习决策树算法ID3.docx

决策树的经典算法ID3与C45.docx

基于ID3决策树算法接触网检修方案的研究.docx

ID3决策树原理.docx

id3_ID3算法决策树_

ID3算法实现决策树

c语言版决策树的ID3算法

基于MapReduce的ID3决策树分类算法研究.docx

基于粗糙集的ID3决策树算法改进.docx

机器学习决策树-ID3算法的源代码.docx

matlab实现的ID3分类决策树算法解析.docx

决策树原理，设计过程，实例.docx

决策树ID3算法的实现

ID3算法决策树程序

决策树ID3算法的应用

决策树_ID3算法.pptx

机器学习分类算法实验报告.docx

决策树.docx

1实验1-ID3算法填空及决策树构建.docx

决策树 ID3算法在银行信贷业务中的应用.docx

基于昵称检测和ID3决策树算法的僵尸网络检测方法.docx

最新资源