【免费】35.Bagging和Boosting的区别1_bagging和boosting的区别资源-CSDN文库

需积分: 0 184 浏览量 2022-08-03 20:28:46 上传评论收藏 194KB PDF 举报

资源详情

资源评论

资源推荐

1.Bagging之随机森林

随机森林改变了决策树容易过拟合的问题，这主要是由两个操作所

优化的：

（1）Boostrap从袋内有放回的抽取样本值

（2）每次随机抽取一定数量的特征（通常为sqr(n))

分类问题：采用Bagging投票的方式选择类别频次最高的

回归问题：直接取每棵树结果的平均值

常见参数：树最大深度、树的个数、节点上的最小样本数、特征数

误差分析：将每个树的未采样样本作为预测样本统计误差作为误分

率

优点：可以并行计算；不需要特征选择；可以总结出特征重要性；

可以处理缺失数据；不需要额外设计测试集

缺点：在回归上不能输出连续结果

2.Boosting之Adaboost

Boosting的本质实际上是一个加法模型，通过改变训练样本权重学

习多个分类器进行一些线性组合。而Adaboost就是加法模型+指数损失

函数+前项分布算法。Adaboost就是从弱分类器出发反复训练，在其中

不断调整数据权重或概率分布，同时提高前一轮被弱分类器误分的样本

的权值。最后用分类器进行投票表决（但是分类器的重要性不同）。

3.Boosting之GBDT

将基分类器变成二叉树，回归用回归二叉树，分类用分类二叉树。

和上面的Adaboost相比，回归树的损失函数为平方损失，可以用指数损

失函数定义分类问题。但是对于一般损失函数怎么计算呢？GBDT（梯度

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

评论0

内容反馈

阿玫小酱当当囧

粉丝: 14
资源: 324

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip