没有合适的资源?快使用搜索试试~ 我知道了~
Transformer Pytorch代码解读.pptx
需积分: 0 19 下载量 28 浏览量
2023-07-20
14:52:59
上传
评论
收藏 4.4MB PPTX 举报
温馨提示
试读
18页
本课件是对 CV&NLP 领域经典模型 Transformer 的 Pytorch 代码解读。
资源推荐
资源详情
资源评论
Transformer 代码解读
Transformer 架构
2
编码器
• 由N个block堆叠而成;
• 每个block有两层:
• Multi-Head Attention (Self-Attention)
+ Add (Residual Connection)
+ Norm (LayerNorm);
• Feed Forward
+ Add (Residual Connection)
+ Norm (LayerNorm);
• Block
1
~Block
N-1
的输出:输入到下个
Block;
• Block
N
的输出:输入到解码器的各层中。
解码器
• 由N个block堆叠而成;
• 每个block有三层:
• Masked Multi-Head Attention (Self-Attention)
+ Add (Residual Connection)
+ Norm (LayerNorm);
• Multi-Head Attention (Co-Attention)
+ Add (Residual Connection)
+ Norm (LayerNorm);
• Feed Forward
+ Add (Residual Connection)
+ Norm (LayerNorm);
• Block
1
~Block
N-1
的输出:输入到下个Block;
• Block
N
的输出:输入到后续的Linear层中。
Transformer 架构
3
剩余17页未读,继续阅读
资源评论
_Meilinger_
- 粉丝: 300
- 资源: 17
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功