没有合适的资源?快使用搜索试试~ 我知道了~
keras学习率余弦退火CosineAnnealing
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
7 下载量 66 浏览量
2021-01-06
14:05:31
上传
评论
收藏 186KB PDF 举报
温馨提示
试读
5页
keras学习率余弦退火CosineAnnealing1.引言2.余弦退火的原理3.keras实现 1.引言 当我们使用梯度下降算法来优化目标函数的时候,当越来越接近Loss值的全局最小值时,学习率应该变得更小来使得模型不会超调且尽可能接近这一点,而余弦退火(Cosine annealing)可以通过余弦函数来降低学习率。余弦函数中随着x的增加余弦值首先缓慢下降,然后加速下降,再次缓慢下降。这种下降模式能和学习率配合,以一种十分有效的计算方式来产生很好的效果。 在论文Stochastic Gradient Descent with Warm Restarts中介绍主要介绍了带重启的随机梯度下
资源详情
资源评论
资源推荐
keras学习率余弦退火学习率余弦退火CosineAnnealing
keras学习率余弦退火学习率余弦退火CosineAnnealing1.引言2.余弦退火的原理3.keras实现
1.引言引言
当我们使用梯度下降算法来优化目标函数的时候,当越来越接近
Loss
值的全局最小值时,学习率应该变得更小来使得模型不
会超调且尽可能接近这一点,而余弦退火(
Cosine annealing
)可以通过余弦函数来降低学习率。余弦函数中随着
x
的增加余
弦值首先缓慢下降,然后加速下降,再次缓慢下降。这种下降模式能和学习率配合,以一种十分有效的计算方式来产生很好的
效果。
在论文Stochastic Gradient Descent with Warm Restarts中介绍主要介绍了带重启的随机梯度下降算法(带重启的随机梯度下降算法(SGDR)),其中就引
入了余弦退火余弦退火的学习率下降方式,本文主要介绍余弦退火的原理以及实现。并且因为我们的目标优化函数可能是多峰的(如下
图所示),除了全局最优解之外还有多个局部最优解,在训练时梯度下降算法可能陷入局部最小值,此时可以通过突然提高学
习率,来“跳出”局部最小值并找到通向全局最小值的路径。这种方式称为带重启的随机梯度下降方法。
weixin_38672807
- 粉丝: 9
- 资源: 925
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0