CART 算法
•
决策树主要有三种实现,分别是 ID3 算法, CART 算法和 C4.5 算
法。 CLASSIFICATION AND REGRESSION TREE ,即分类回归树算法,简称 CART
算法,它是决策树的一种实现。
•
CART 算法是一种二分递归分割技术,把当前样本划分为两个子样本,使得生成的每个
非叶子结点都有两个分支,因此 CART 算法生成的决策树是结构简洁的二叉树。由于
CART 算法构成的是一个二叉树,它在每一步的决策时只能是“是”或者“否”,即使一个
FEATURE 有多个取值,也是把数据分为两部分。在 CART 算法中主要分为两个步骤
•
( 1 )将样本递归划分进行建树过程
•
( 2 )用验证数据进行剪枝
•
CART 在分类树和回归树中的区别: CART 在分类树中基于基尼指数使用特征对数据集
进行划分, CART 在回归树中是基于 MSE(MEAN SQUARE ERROR) 或者
MAE(MEAN ABSOLUTE ERROR) 使用特征对数据集进行划分
评论0
最新资源