谷歌FLAN-T5作者亲讲：5400亿参数，1800个任务，如何实现大语言模型“自我改进”_鲟曦研习社.pdf资源-CSDN文库

需积分: 1 53 浏览量 2023-05-18 13:45:22 上传评论收藏 1.71MB PDF 举报

资源推荐

资源详情

资源评论

4/23/23, 2:20 PM

谷歌FLAN-T5作者亲讲：5400亿参数，1800个任务，如何实现大语言模型“自我改进”_鲟曦研习社

https://www.kuxai.com/article/560

1/13

 收起内容

  登录 / 注册

Beta

首页

社区

技术

Open AI

 搜索

反馈

4/23/23, 2:20 PM

谷歌FLAN-T5作者亲讲：5400亿参数，1800个任务，如何实现大语言模型“自我改进”_鲟曦研习社

https://www.kuxai.com/article/560

2/13

机器学习算法与自然

语言处理

一个有情怀的自媒体账

号。机器学习、自然语言…

文章来源作者原创

赞同统计 0

反对统计 0

浏览统计 654

评论统计 0

发布时间 2022/12/02 22:34

二维码

自定义二维码

网站

自定义网站或网址

上一篇

程序员开发正遭 AI 「革命」

下一篇

AI的未来不是大模型，也不是端到端：Meta…

谷歌FLAN-T5作者亲讲：5400亿参数，1800

个任务，如何实现大语言模型“自我改进”

机器学习问题生成大语言模型

2021年，谷歌的研究者们提出了FLAN大模型，其基于Instruction Tuning的方式，极大地提升了大语言模

型的理解能力。同时，各种Prompting方法的涌现预示着针对大模型的下游微调将成为研究领域关注的重

点。

近日，谷歌研究者们再一次推进了Instruction Tuning的性能水平，模型模型参数上升至540B，微调任务的

数量则高达1800多个，此外他们还采用了最新的Prompting机制——Chain of Thought（CoT），让语言模

型有了自我改进的能力。

智源社区邀请了该工作的主要研究者——谷歌软件高级工程师侯乐博士。请他讲解新型微调方式在提升大

规模语言模型性能方面的思路。

侯乐

侯乐博士近期在Google的研究主要集中在NLP方面，包括高效的语言模型训练、指令微调和提示工程等。

他的一个核心兴趣是通过更好的微调和提示工程来提高最先进语言模型的推理能力。在加入谷歌之前，侯

乐在纽约州立大学石溪分校获得了博士学位。博士在读期间，他专注于分析高分辨率图像，如卫星和医学

图像。

 收起内容

作者信息

1

基于度量的元学习和基于优化的元学习

2

知识图谱嵌入的Translate模型汇总（TransE…

3

现代NLP中的零样本学习

4

从BERT、XLNet到MPNet，细看NLP预训练…

5

NLP中的自监督表示学习，全是动图，很过…

6

BERT的youxiu变体：ALBERT论文图解介绍

7

来自AI专家的13篇必读论文

8

10个算法从业人员必须知道的TensorFlow技…

9

Batch Normalization的诅咒

10

OneNet：一阶段的端到端物体检测器，无…

文章信息

  登录 / 注册

Beta

首页

社区

技术

Open AI

 搜索

反馈

剩余12页未读，继续阅读

内容反馈

Java徐师兄

粉丝: 1540
资源: 2309

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip