没有合适的资源?快使用搜索试试~ 我知道了~
随机森林算法参数详解与调优指南
需积分: 5 1 下载量 27 浏览量
2024-09-22
15:16:03
上传
评论
收藏 1013KB PDF 举报
温馨提示
内容概要:本文深入探讨了随机森林类库中的关键参数及其意义,并提供了一个逐步的调参教程。文章覆盖了框架级别的参数如n_estimators, bootstrap, oob_score以及决策树层面的多个属性比如max_features, max_depth等,并给出了参数优化的实际例子。 适合人群:适用于正在研究随机森林分类器并希望改进其性能的数据科学家和技术人员。 使用场景及目标:帮助技术人员理解和调整用于特定任务的随机森林参数,并提高他们模型预测的质量。 其他说明:阅读此文将有助于更好地掌握Sklearn中RF类的配置细节及其带来的影响。通过参数的选择可以有效增强模型性能。
资源推荐
资源详情
资源评论
2020/2/16 【实践】随机森林算法参数解释及调优
https://mp.weixin.qq.com/s?__biz=MzU0MDQ1NjAzNg==&mid=2247484949&idx=1&sn=79dbfbdabd6cd5d9e69c00a4e82bf7e8&chksm=fb39a31…
1/5
【实践】随机森林算法参数解释及调优
前言
上篇文章梳理了随机森林的各理论要点,本文首先详细解释了随机森林类的参数含义,并基于该类讲
解了参数择优过程。
随机森林类库包含了RandomForestClassifer类,回归类是RandomForestRegressor类。RF的变种
ExtraTress也有ExtraTressClassifier类和ExtraTressRegressor类。由于这四个类的参数基本相同,只
要完全理解其中一个类,其他三个类很快就能上手。本文只介绍RandomForestClassifer类。
随机森林是基于bagging框架的决策树模型,因此随机森林的参数择优包括两部分:(1)RF框架的参
数择优;(2)RF决策树的参数择优。因此,理解RF框架参数和决策树参数的含义是模型参数择优的前
提。
目录
1. RF框架参数含义
2. RF决策树参数含义
3. RF参数择优实例
4. 结论
请参考Scikit-learn官网RandomForestClassifier类的参数来阅读前两节:
RF框架参数含义
n_estimators : 对 原 始 数 据 集 进 行 有 放 回 抽 样 生 成 的 子 数 据 集 个 数 , 即 决 策 树 的 个 数 。 若
n_estimators太小容易欠拟合,太大不能显著的提升模型,所以n_estimators选择适中的数值,版
本0.20的默认值是10,版本0.22的默认值是100 。
bootstrp:是否对样本集进行有放回抽样来构建树,True表示是,默认值True
oob_score:是否采用袋外样本来评估模型的好坏,True代表是,默认值False,上篇文章提到袋外
样本误差是测试数据集误差的无偏估计,所以推荐设置True。
RF框架的参数很少,框架参数择优一般是调节n_estimators值,即决策树个数。
RF决策树参数含义
原创
石头 2018-11-30机器学习算法那些事
资源评论
风轻扬1314
- 粉丝: 112
- 资源: 548
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功