没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐
动⼿学深度学习
0.6
MXNet Community
2018 年 05 ⽉ 07 ⽇
⽬录
1 前⾔ 3
1.1 为什么要做这个项⽬ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 前⾔ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 主要符号⼀览 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 预备知识 11
2.1 机器学习简介 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 安装和运⾏ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 数据操作 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4 ⾃动求梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3 深度学习模型基础 47
3.1 线性回归——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2 线性回归——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.3 多类逻辑回归——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.4 多类逻辑回归——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.5 多层感知机——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.6 多层感知机——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.7 ⽋拟合和过拟合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.8 正则化——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.9 正则化——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.10 丢弃法(Dropout)——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.11 丢弃法(Dropout)——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.12 正向传播和反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
i
3.13 实战 Kaggle ⽐赛:预测房价和 K 折交叉验证 . . . . . . . . . . . . . . . . . . . 102
4 深度学习计算基础 117
4.1 模型构造 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.2 模型参数的访问、初始化和共享 . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.3 模型参数的延后初始化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.4 ⾃定义层 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
4.5 读取和存储 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.6 GPU 计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5 卷积神经⽹络 139
5.1 卷积神经⽹络——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.2 卷积神经⽹络——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
5.3 批量归⼀化——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
5.4 批量归⼀化——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
5.5 深度卷积神经⽹络:AlexNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
5.6 使⽤重复元素的⽹络:VGG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
5.7 ⽹络中的⽹络:NiN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
5.8 含并⾏连结的⽹络:GoogLeNet . . . . . . . . . . . . . . . . . . . . . . . . . . 170
5.9 残差⽹络:ResNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
5.10 稠密连接的⽹络:DenseNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
6 循环神经⽹络 187
6.1 循环神经⽹络——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
6.2 通过时间反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
6.3 ⻔控循环单元(GRU)——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . 211
6.4 ⻓短期记忆(LSTM)——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . 218
6.5 循环神经⽹络——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
7 优化算法 235
7.1 优化算法概述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
7.2 梯度下降和随机梯度下降——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . 240
7.3 梯度下降和随机梯度下降——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . 250
7.4 动量法——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
7.5 动量法——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
7.6 Adagrad——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264
7.7 Adagrad——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
7.8 RMSProp——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
ii
7.9 RMSProp——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
7.10 Adadelta——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
7.11 Adadelta——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
7.12 Adam——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
7.13 Adam——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
8 计算性能 291
8.1 命令式和符号式混合编程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
8.2 惰性计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
8.3 ⾃动并⾏计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
8.4 多 GPU 计算——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
8.5 多 GPU 计算——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
9 计算机视觉 321
9.1 图⽚增⼴ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
9.2 迁移学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
9.3 ⽬标检测 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
9.4 ⽬标检测模型:SSD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
9.5 ⽬标检测模型:YOLO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375
9.6 语义分割 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
9.7 样式迁移 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
9.8 实战 Kaggle ⽐赛:对原始图像⽂件分类(CIFAR-10) . . . . . . . . . . . . . . 415
9.9 实战 Kaggle ⽐赛:识别 120 种狗 (ImageNet Dogs) . . . . . . . . . . . . . . 426
10⾃然语⾔处理 439
10.1 词向量:word2vec . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439
10.2 词向量:GloVe 和 fastText . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
10.3 应⽤词向量:求近似词和类⽐词 . . . . . . . . . . . . . . . . . . . . . . . . . . . 449
10.4 ⽂本分类:情感分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455
10.5 编码器—解码器(seq2seq)和注意⼒机制 . . . . . . . . . . . . . . . . . . . . . 463
10.6 应⽤编码器—解码器和注意⼒机制:机器翻译 . . . . . . . . . . . . . . . . . . . . 467
11附录 479
11.1 数学基础 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 479
11.2 在 AWS 上运⾏教程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480
11.3 GPU 购买指南 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490
iii
剩余500页未读,继续阅读
思想假
- 粉丝: 25
- 资源: 326
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0