人工智能-transformer-pytorch实现代码-详细解析-更深入理解 transformer
本文主要是对 transformer使用 Pytorch 实现的一个逐句解析,包含 transformer 原理部分未讲到的正则部分优化以及动态学习率等,以及有些代码实现的思路帮助理解,适合刚学刚用 transformer 的朋友一起学习,使用 transformer 的优势在于提取语义信息可以用作不同工作场景,原理篇以及代码实现解析篇可以见:"https://blog.csdn.net/Lian_Ge_Blog/article/details/132783696spm=1001.2014.3001.5501" 和 "https://blog.csdn.net/Lian_Ge_Blog/article/details/133004380spm=1001.2014.3001.5501"