【免费】7.过拟合问题1_什么是过拟合？资源-CSDN文库

需积分: 0 169 浏览量 2022-08-03 23:59:06 上传评论收藏 436KB PDF 举报

资源详情

资源评论

资源推荐

1.什么是过拟合

2.降低过拟合的办法

2.1正则化

2.2随机失活（Dropout)

2.3逐层/批归一化（batchnormalization)

2.4提前终止（earlystopping)

2.5数据集扩增（dataaugmentation)

1.什么是过拟合

随着训练过程的进行，模型复杂度增加，在训练集上的error逐渐减小，在验证集上

的error逐渐增大——因为训练出来的网络过拟合了训练集，导致泛化性能差。

传统的函数拟合问题，一般是通过物理数学等推导出的一个含参数的模型（数学建

模），模型复杂度是确定的，没有多余的能力拟合噪声。而机器学习算法的复杂度更高，

一般都远高于具体问题的复杂度，数据量不足以支撑庞大的模型/参数。

有一个概念需要先说明，在机器学习算法中，我们常常将原始数据集分为三部分：training

data、validationdata，testingdata。这个validationdata是什么？它其实就是用来避免过拟

合的，在训练过程中，我们通常用它来确定一些超参数（比如根据validationdata上的accuracy

来确定earlystopping的epoch大小、根据validationdata确定learningrate等等）。那为啥不

直接在testingdata上做这些呢？因为如果在testingdata做这些，那么随着训练的进行，我们的

网络实际上就是在一点一点地overfitting我们的testingdata，导致最后得到的testingaccuracy

没有任何参考意义。因此，trainingdata的作用是计算梯度更新权重，validationdata如上所

述，testingdata则给出一个accuracy以判断网络的好坏。

2.降低过拟合的办法

2.1正则化

L2

正

则

化

：目标函数中增加所有权重w参数的平方之和，逼迫所有w尽可能趋向零但不为

零。因为过拟合的时候，拟合函数需要顾忌每一个点，最终形成的拟合函数波动很大，在

某些很小的区间里，函数值的变化很剧烈，也就是某些w非常大。为此，L2正则化的加入

就惩罚了权重变大的趋势。

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余2页未读，立即下载

评论0

内容反馈

阿葱的葱白

粉丝: 26
资源: 313

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip