预训练模型的记忆机制解密！.pdf_记忆机制资源-CSDN文库

版权申诉

145 浏览量 2023-08-12 22:45:28 上传评论收藏 1.47MB PDF 举报

资源推荐

资源详情

资源评论

2023/6/28 17:00

预训练模型的记忆机制解密！

https://mp.weixin.qq.com/s/rmeDB1FwtnDGrvpNgy_cOA

1/7

预训练模型的记忆机制解密！

文  | pyt hon

近年来，大规模预训练语言模型给自然语言处理领域带来了翻天覆地的变化。

一提到预训练模型为什么好，标准回答往往是：利用了无标注自监督学习数据，习得了语言学

与语义知识，并有效迁移到下游任务中。

然而，预训练模型究竟如何运用预训练过程中记住的内容呢？

本文作者借助英文习语生成任务，探秘预训练模型的记忆唤起机制。

作者发现，在记忆唤起中，底层结构存储与检索可能的表达组合，并形成若干候选，而上层结

构会进一步强化模型的信心。

论文题目：

UnderstandingTransformerMemorization Recall ThroughIdioms

论文链接：

https://arxiv.org/abs/2210.03588

https://github.com/adihaviv/idiomem/

习语生成检测

为了探索预训练模型运用记忆的方式，首先需要找到一种上下文无关的生成文本。否则，无法

python 2022-10-24 12:05 发表于北京

原创

夕小瑶科技说

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余6页未读，立即下载

内容反馈

版权申诉

地理探险家

粉丝: 1046
资源: 5416

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip