没有合适的资源?快使用搜索试试~ 我知道了~
零基础入门深度学习(6) - 长短时记忆网络(LSTM) - 作业部落 Cmd Markdown 编辑阅读器.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 83 浏览量
2021-09-20
03:16:10
上传
评论
收藏 2.14MB PDF 举报
温馨提示
零基础入门深度学习(6) - 长短时记忆网络(LSTM) 零基础入门深度学习系列文章旨在帮助爱编程的读者从零基础达到入门级水平,不需要太多的数学知识,只要会写程序就行了。长短时记忆网络(Long Short Term Memory Network,LSTM)是循环神经网络(Recurrent Neural Network,RNN)的变体,成功解决了原始RNN很难处理长距离依赖的缺陷,成为当前最流行的RNN,在语音识别、图片描述、自然语言处理等许多领域中成功应用。 长短时记忆网络的产生背景是为了解决原始RNN的缺陷,即梯度消失和梯度爆炸问题。梯度消失是指误差项沿时间反向传播的公式中,误差项的值的上界是指数函数,导致梯度的值变得极小或极大。梯度消失使得网络无法处理长距离依赖的问题。 长短时记忆网络的结构相比原始RNN更加复杂,但它成功解决了原始RNN的缺陷。长短时记忆网络增加了一个状态,即单元状态(cell state),用来保存长期的状态。长短时记忆网络的输入有三个:当前时刻网络的输入值、上一时刻LSTM的输出值、以及上一时刻的单元状态;输出有两个:当前时刻的输出值和当前时刻的单元状态。 长短时记忆网络的优点是可以处理长距离依赖的问题,使得它在自然语言处理、语音识别、图片描述等领域中得到了广泛应用。同时,长短时记忆网络的变体GRU(Gated Recurrent Unit)也逐渐流行起来,结构比LSTM简单,而效果却和LSTM一样好。 长短时记忆网络是深度学习中一个非常重要的概念,对于自然语言处理、语音识别、图片描述等领域中的应用非常广泛。了解长短时记忆网络可以帮助读者更好地理解深度学习的原理和应用。
资源推荐
资源评论
资源评论
普通网友
- 粉丝: 48
- 资源: 8282
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功