决策树算法实验报告
摘要
众所周知,数据库技术从 20 世纪 80 年代开始,已经得到广泛的普及和应用。
随着数据库容量的膨胀,特别是数据仓库以及 web 等新型数据源的日益普及,人
们面临的主要问题不再是缺乏足够的信息可以使用,而是面对浩瀚的数据海洋如何
有效地利用这些数据。
从数据中生成分类器的一个特别有效的方法是生成一个决策树。决策树表示方
法是应用最广泛的逻辑方法之一,它从一组无次序、无规则的事例中推理出决策树
表示形式的分类规则。决策树分类方法采用自顶向下的递归方式,在决策树的内部
结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,在决策树的
叶结点得到结论。所以从决策树的根到叶结点的一条路径就对应着一条合取规则,
整棵决策树就对应着一组析取表达式规则。