3.10 ⽋拟合、过拟合和模型选择 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.11 权重衰减——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.12 权重衰减——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.13 丢弃法——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.14 丢弃法——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.15 正向传播和反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.16 实战 Kaggle ⽐赛:预测房价 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4 深度学习计算 109
4.1 模型构造 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.2 模型参数的访问、初始化和共享 . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.3 模型参数的延后初始化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.4 ⾃定义层 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.5 读取和存储 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.6 GPU 计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5 卷积神经⽹络 133
5.1 ⼆维卷积层 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.2 填充和步幅 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.3 多输⼊和输出通道 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.4 池化层 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
5.5 卷积神经⽹络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
5.6 深度卷积神经⽹络:AlexNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
5.7 使⽤重复元素的⽹络:VGG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
5.8 ⽹络中的⽹络:NiN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
5.9 含并⾏连结的⽹络:GoogLeNet . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
5.10 批量归⼀化——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
5.11 批量归⼀化——使⽤ Gluon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
5.12 残差⽹络:ResNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
5.13 稠密连接⽹络:DenseNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
6 循环神经⽹络 187
6.1 语⾔模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
6.2 隐藏状态 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
6.3 循环神经⽹络——从零开始 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
ii
评论0
最新资源