没有合适的资源?快使用搜索试试~ 我知道了~
机器学习机器学习在R中的应用 线性回归与logistic (1) 由很多决策树分类组合而成(因而称为“森林”) (2) 单个的决策树分类器用随机方法构成。首先,学习集是从原训练集中通过有放回抽样 得到的自助样本。其次,参不构建该决策树的变量也是随机抽出,参不变量数通常大 大小于可用变量数。 (3) 单个决策树在产生学习集和确定参不变量后,使用CART算法计算,不剪枝 剪枝为了防止过度拟合,通过投票可以抵消随机误差,所以不用剪枝 (4) 最后分类结果取决于各个决策树分类器简单多数选举
资源推荐
资源详情
资源评论
石家庄学院 [机器学习 1.0]
第 1 页 共 72 页
机器学习
石家庄学院 [机器学习 1.0]
第 2 页 共 72 页
目录
目录....................................................................................................................................................2
参考资料............................................................................................................................................3
手册目的............................................................................................................................................3
1.线性回归与 logistic........................................................................................................................4
1.1 一元线性回归模型..............................................................................................................4
1.1.1 一元的产生及参数估计...........................................................................................4
1.1.2 一元线性回归的建立...............................................................................................6
1.1.3 回归模型的检验.......................................................................................................7
1.1.4 回归模型的优缺点...................................................................................................8
1.2 多元线性回归......................................................................................................................8
1.3 广义线性模型....................................................................................................................14
1.4 非线性模型........................................................................................................................19
2.多重共线性的解决.......................................................................................................................25
2.1 为什么解决多重共线性....................................................................................................25
2.1.1 解决多重共线性的知识前提.................................................................................25
2.1.2 原因.........................................................................................................................26
-2.2 解决多重共线性的方法 ..................................................................................................26
2.2.1.岭回归.....................................................................................................................26
2.2.2.LASSO....................................................................................................................33
2.2.3.LAR.........................................................................................................................36
3.降维技术.......................................................................................................................................36
3.1 主成分分析........................................................................................................................36
3.1.1 什么是主成分分析.................................................................................................36
3.1.2 基本思想.................................................................................................................37
3.1.3 直观几何意义.........................................................................................................37
3.1.4 数学模型.................................................................................................................38
3.1.5 相关的 R 函数........................................................................................................40
3.1.6 实例展示.................................................................................................................41
3.2 因子分析...........................................................................................................................44
3.2.1 什么是因子分析....................................................................................................44
3.2.2 数学模型................................................................................................................45
3.3.3 因子分析计算函数................................................................................................46
3.3 二者的联系与区别............................................................................................................48
4.分类模型与算法...........................................................................................................................48
4.1 分类算法相关简介............................................................................................................48
4.1.1 什么是分类............................................................................................................48
4.1.2 聚类、监督学习、非监督学习............................................................................49
4.1.3 分类应用-文本挖掘场景 ......................................................................................49
4.2 常见分类算法与模型........................................................................................................51
4.2.1 线性判别法............................................................................................................51
石家庄学院 [机器学习 1.0]
第 3 页 共 72 页
4.2.2 距离判别法......................................................................................................52
4.2.3 贝叶斯分类器..................................................................................................54
4.2.4 决策树..............................................................................................................58
4.2.5 组合算法..........................................................................................................66
4.2.6 支持向量机(svm) ..................................................................................................72
4.2.7 神经网络................................................................................................................72
参 考资 料
1.R 统计建模与 R 软件(薛毅版)
2.炼数成金-机器学习视频
手 册目 的
1.对机器学习有初步了解,可以较为熟练的掌握机器学习在 R 中的应用。
石家庄学院 [机器学习 1.0]
第 4 页 共 72 页
1.线性回归与 logistic
1.1 一元线性回归模型
1.1.1 一元的产生及参数估计
(1)关系
(1)函数关系:确定性关系 y=10x+3;
(2)相关关系:非确定性关系;
(2)相关系数
衡量线性相关性强弱的参数,该值越大,说明线性相关越强。
正相关:x,y 同增同跌;负相关:x,y 增跌相反.
(3)参数
1. 2. 3. 4.
(4)如何确定参数
1.
使用平方误差和衡量 预测值与真实值的差距,平方误差真实值 y,预测值 y^,则平方误
石家庄学院 [机器学习 1.0]
第 5 页 共 72 页
差就是 ,寻找合适的参数,使得平方误差和
最小。
2.
之所以不选用点到直线的垂直距离,是因为运算时带有根号,使运算变得复杂。
3.
最小二乘法:
几何模型:
使用最小二乘法求解参数:Rss 其实是 a 与 b 的参数,分别对 a 与 b 求偏导并令偏导等于 0,
就可以得出 a 与 b 的值。
剩余71页未读,继续阅读
资源评论
softshow1026
- 粉丝: 978
- 资源: 224
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功