没有合适的资源?快使用搜索试试~ 我知道了~
斯坦福CS229机器学习中文讲义(2022春季).pdf
需积分: 5 2 下载量 71 浏览量
2024-02-29
14:44:58
上传
评论
收藏 6.06MB PDF 举报
温馨提示
试读
216页
斯坦福CS229机器学习中文讲义(2022春季)
资源推荐
资源详情
资源评论
CS229 机器学习讲义
Andrew Ng
由马腾宇更新
目录
I 监督学习 5
1 线性回归 8
1.1 LMS算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 正规方程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.1 矩阵导数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.2 最小二乘法再探 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3 概率解释 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4 局部加权线性回归(可选阅读) . . . . . . . . . . . . . . . . . . . . . . . 17
2 分类和逻辑回归 20
2.1 逻辑回归 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 离题:感知器学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3 另一种最大化 `(θ)的算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3 广义线性模型 26
3.1 指数族 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.2 构建广义线性模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2.1 普通最小二乘法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.2 逻辑回归 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.3 Softmax回归 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4 生成学习算法 35
4.1 高斯判别分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.1.1 多元正态分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.1.2 高斯判别分析模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.1.3 讨论:GDA和逻辑回归 . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2 朴素贝叶斯 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.2.1 拉普拉斯平滑 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2.2 文本分类的事件模型 . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1
CS229 2022年春季 2
5 核方法 49
5.1 特征映射 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.2 具有特征的LMS(最小均方) . . . . . . . . . . . . . . . . . . . . . . . . 50
5.3 具有核技巧的LMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.4 核函数的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
6 支持向量机 60
6.1 间隔:直觉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6.2 符号表示(可选阅读) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.3 函数和几何间隔(可选阅读) . . . . . . . . . . . . . . . . . . . . . . . . 62
6.4 最优间隔分类器(可选阅读) . . . . . . . . . . . . . . . . . . . . . . . . 64
6.5 拉格朗日对偶性(可选阅读) . . . . . . . . . . . . . . . . . . . . . . . . 66
6.6 最优间隔分类器:对偶形式(可选阅读) . . 69
6.7 正则化和非可分情况(可选阅读) . 73
6.8 SMO算法(可选阅读) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.8.1 坐标上升 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.8.2 SMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
II 深度学习 80
7 深度学习 81
7.1 非线性模型的监督学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
7.2 神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7.3 反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.3.1 初步:链式法则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.3.2 单神经元神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.3.3 两层神经网络:低级展开计算
计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.3.4 两层神经网络的向量表示 . . . . . . . . . . . . . . . . . . . . . . . 97
7.3.5 多层神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
7.4 向量化训练样本 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
III 泛化和正则化 102
8 泛化 103
8.1 偏差-方差权衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .105
8.1.1 数学分解(用于回归). . . . . . . . . . . . . . . . . . . . . . . . . .110
8.2 双下降现象 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
CS229 2022年春季 3
8.3 样本复杂度界限(可选阅读) . . . . . . . . . . . . . . . . . . . . . . . 116
8.3.1 准备工作 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
8.3.2 有限 H的情况. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .118
8.3.3 无限 H的情况. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .121
9 正则化和模型选择 125
9.1 正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
9.2 隐式正则化效应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
9.3 通过交叉验证进行模型选择 . . . . . . . . . . . . . . . . . . . . . . . . . . 129
9.4 贝叶斯统计和正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
IV 无监督学习 134
10 聚类和 k均值算法 135
11 EM算法 138
11.1 高斯混合模型的EM算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
11.2 Jensen不等式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
11.3 通用EM算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
11.3.1 ELBO的其他解释 . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
11.4 重新审视高斯混合模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
11.5 变分推断和变分自编码器(可选
阅读) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
12 主成分分析 155
13 独立成分分析 161
13.1 ICA的模糊性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .162
13.2 密度和线性变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .163
13.3 ICA算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
14 自监督学习和基础模型 167
14.1 预训练和适应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
14.2 计算机视觉中的预训练方法 . . . . . . . . . . . . . . . . . . . . . . . . . 169
14.3 预训练的大型语言模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
14.3.1 零样本学习和上下文学习 . . . . . . . . . . . . . . . . . . . . . 173
CS229 2022年春季 4
V 强化学习和控制 175
15 强化学习 176
15.1 马尔可夫决策过程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
15.2 值迭代和策略迭代 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
15.3 学习MDP的模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
15.4 连续状态MDP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .183
15.4.1 离散化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
15.4.2 值函数逼近 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
15.5 策略和值迭代之间的联系(可选). . 190
16 LQR,DDP和LQG 193
16.1 有限时间段MDP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
16.2 线性二次调节(LQR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
16.3 从非线性动力学到LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
16.3.1 动力学的线性化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .201
16.3.2 微分动态规划(DDP) . . . . . . . . . . . . . . . . . . . . . 201
16.4 线性二次高斯(LQG) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
17 策略梯度(REINFORCE) 207
剩余215页未读,继续阅读
资源评论
绝不原创的飞龙
- 粉丝: 1w+
- 资源: 1091
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功