关于语言大模型的八大论断_对大模型的看法资源-CSDN文库

需积分: 1 165 浏览量 2023-06-27 09:55:52 上传评论收藏 836KB PDF 举报

资源推荐

资源详情

资源评论

关于语言大模型的八大论断

近几个月来，语言大模型（LLM）的广泛公开部署引起了倡导

者、政策制定者和许多领域学者们的新一轮关注和参与。本文

主要总结了八个可能引发思考的观点，并讨论了 LLM 还存在的

局限性。

 即便没有针对性的创新，LLM 的能力也会随着投资的增加

而可预估地增强

 LLM 中的一些重要行为往往作为增加投资的“ 副产品” 不可

预测地出现

 LLM 经常学习并使用外部世界的表征

 目前还没有可靠的技术来引导 LLM 的行为

 专家们还不能解释 LLM 的内部运作情况

 人类在一项任务上的表现并不是 LLM 表现的上限

 LLM 不需要表达其创造者的价值观，也不需要表达网络文

本中编码的价值观

 与 LLM 的简短互动往往具有误导性

语言大模型及其衍生产品，如 Ch atGPT 等，最近引起了记者、政

策制定者和学者们的极大关注。然而，该技术在许多方面都没有

达到人们的预期效果，对它的简要概述往往容易忽略重点。本

文提出了八个大胆论断，预计这些论断在 LL M 相关讨论中将引起

关注。它们代表着模型开发人员对 LL M 的普遍看法。本文的目

的并非针对 LLM 提出规范性意见。对于颠覆性新技术的态度应该

由核心技术研发社区之外的学者、倡导者和立法者们在充分了解

情况的基础上决定。 1 即便没有针对性创新， LLM 的能力

也会随着投资的增加而可预估地增强规模定律（s c a l i n g

law）是近期 LLM 研究和投资激增的主要原因。有了规模定律，

当沿着模型输入的数据量、模型大小（参数量）以及训练模型的

计算量（以 F L O P 为单位））扩展 LLM 时，我们将能够预测模

型的未来能力。这样在面对关键设计决策时就可以直接作决策，

无需耗费巨资反复试验。这种精确预测能力在软件史，甚至现

代人工智能研究史上都是不同寻常的。这也是推动投资的强大工

具，有了这一预测能力，研发团队可以进行耗资数百万美元的模

型训练项目，并确保这些项目能成功产生有经济价值的系

以下面三个截然不同的系统为例：O p e n A I 的原始 G P T 能够执行

简单的文本标注任务，但无法生成连贯性文本；G P T - 2 增加了生

成相对高质量文本的能力，并且能够有限地遵循简单指令；G P T - 3

是第一个现代通用型 LL M，在各种语言任务上都具有实用性。这

三个模型在设计上几乎没有太大差异，它们的性能差异主要源于

规模， G P T - 3 的训练计算量大约是原始 G P T 的 2 0 0 0 0 倍，且拥有

更多的数据和参数。这三个模型之间存在重大创新，但几乎都是

基础设施创新，而并非语言模型方面的设计创新。虽然目前

LLM 训练技术不再普遍公开，但最近的报告表明，现在语言大模

型的发展趋势与上面的预测只有轻微偏差，且系统设计基本没有

变化。将这些技术进一步扩展，直至超越 G P T - 3 ，获得了进一

步经济价值回报：后续的 GP T- 4 模型在许多研究生和专业考试中

都超过了人类，其开发还推动了数十亿美元的投资。规模定律使

GPT- 4 的创造者能够以低成本准确预测其性能的关键整体指标：

他们通过拟合小型模型性能的统计趋势，并进行趋势推断来实现

这一预测（见图 1 ），这些模型总共占用了最终模型所需资源的

0.1%。 2LLM 的一些重要行为往往作为增加投资的 “ 副产品”

意外出现通常情况下，规模定律只能预测模型的预训练测试损

失（p r e t r a i n in g test loss ），这测量了模型正确预测不完整

文本将如何延续的能力。尽管这种测量与模型在许多实际任务中

的平均效用之间存在相关性，但无法预测模型将何时展现特定技

能或具备特定任务的能力（参见图 2）。通常情况下，模型可能

在某个任务上一直失败，但将训练规模增加五到十倍时，以同样

方式训练出的新模型会在该任务上表现良

好。

图 2 ：摘自 Wei 等人（2022a）：在语言大模型上评估特定任务或行为的表现通

常不显示可预测的趋势，而且从资源消耗较少的模型版本过渡到资源消耗更多的

版本时，往往会突现新行为。 W e i 等人展示了 B I G- B e n c h 中的任务，

剩余10页未读，继续阅读

内容反馈

sam5198

粉丝: 405
资源: 109

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip