【免费】OpenAI核心研发人员：我们如何开发ChatGPT_大语言模型和GPT的关系资源-CSDN文库

共1个文件

docx：1个

OpenAI

人工智能

需积分: 0 173 浏览量 2023-03-27 17:25:35 上传评论收藏 342KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

OpenAI核心研发人员：我们如何开发ChatGPT.zip （1个子文件）

OpenAI核心研发人员：我们如何开发ChatGPT.docx 377KB

2 月 28 日，OpenAI 的核心研发人员 Jack Rae 在参加 Stanford MLSys

Seminar 的访谈时进行了一个名为 Compression for AGI 的主题分享，

其核心观点为：AGI 基础模型的目标是实现对有效信息最大限度的无损压

缩。并同时给出了为什么这个目标是合理的逻辑分析，以及 OpenAI 是

如何在这个目标下开展工作的行动原则。

我们认为这个不到 1 小时的 talk 是从去年 11 月 ChatGPT 出现以来，

让人能够最大限度理解 OpenAI 工作思路的一个纲领性内容，在深入了

解这个 talk 后，我们会对 OpenAI 的历史行为产生全新的认知，甚至

有可能对其未来的动作进行某种程度的预测。

目前这个 talk 在 YouTube 上的播放量不高（截至 3 月 25 日的播放量

是 4.5k），在国内的讨论更是寥寥无几，OneMoreAI 的学习小组对此

内容进行了深入的学习讨论后形成了一些有趣的想法，在此与各位分享。

一、来自 OpenAI 的观点

让我们先来回顾一下这次 talk 的主要内容，在回顾之前我们介绍一下分

享者：

Jack Rae 是 OpenAI 的团队负责人，主要研究大型语言模型和远程记忆。

此前，他在 DeepMind 工作了 8 年，领导大型语言模型（LLM）研究

组。从身份和经历来看，Jack Rae 可能是最有资格讨论 AGI 基础模型理

念的人之一。

接下来我们回顾一下他在 talk 里的一些核心观点（本文不做详细展开介

绍，更多内容请大家自行观看视频）：

观点 1：对完成某个任务有效方法的最小描述长度代表了对该任务

的最大理解。

比如对英文到中文的翻译任务来说，通过将每个可能的词组查字典进行翻

译，执行方法更复杂，同时效果也不好，所以这是一种描述长度更大的方

法，同时也是一种更差的理解方式，而加入语法、固定词组搭配等规则信

息后，翻译方法的描述长度更小了，并且翻译的结果也会更加准确，所以

是一种更好的理解方式。

由此他提出，更小的有效方法描述长度代表了对任务的更好理解，当我们

对有效方法无损压缩到最小长度时，就得到了对该任务的最优理解。

观点 2：使用大语言模型进行无损压缩可以对最小描述进行计算。

这是第一个让人醍醐灌顶的信息：

大语言模型对任务的理解能力（描述长度）可被量化，所以存在一种计算

方法，能够对一个大语言模型的理解能力可达到的上限进行计算从而预测

其性能。

这对整个基础模型的工作思路带来了一种全新的思考方式，这里我们先对

talk 中的内容进行简单回顾：

�

|D|

表示数据集

的无损压缩；

�

无损压缩的大小可以表示为对

评估的生成模型的负对数似然（即

-log

Pf(D)

）加上估计函数的最小描述长度（即| f | ）；

�

对

评估的生成模型的负对数似然等于对 next token 预测损失的总和，

即可以使用 loss 曲线的面积来计算；

�

估计函数的最小描述长度等于语言模型的描述长度，即可以使用训练代码

的大小来计算。

�

接下来是一个例子，通过上述的公式可以对比不同语言模型谁是更好的压

缩器，以及如何计算出精确的压缩率。

�

模型效果对比：LLaMA 33B 和 LLaMA 65B 两个模型有着相同的数据描

述长度（用于训练的代码大小相同）。65B 模型有着更低的训练损失，根

据我们上面的公式，把两项相加，我们可以知道 65B 是更好的压缩器。

�

压缩比例的计算：LLaMA 65B 用于初始化和训练模型的代码约为 1MB，

粗略地计算负对数似然大约是 400GB，而用于训练的原始数据是 5.6TB

的文本，因此该模型的压缩率为 14 倍。

�

通过这个公式我们还能得到另一个有趣的结论：假设我们在

上预训练，

使得对数似然为 0，那么这个模型对于

的描述是完美的，但此时

| f |

的

评论收藏

内容反馈

a_juvenile

粉丝: 31
资源: 854

OpenAI核心研发人员：我们如何开发ChatGPT

ChatGPT跟它背后的强大团队介绍

中移上海产研院ChatGPT研究：开启AI新纪元

用于化妆品研发的ChatGPT问世了！

ChatGPT：互联网的“效率”革命.pdf

方正证券ChatGPT：互联网的“效率”革命

ChatGPT商业版PHP源码：完整、美观，支付功能、绘画和对话应有尽有，非授权，无反弹 顺便附送详细教程，让你get到技能满分

郭涛：微软ChatGPT与谷歌Bard竞争将会愈演愈烈

ChatGPT，互联网的-效率革命

ChatGPT提高了自然语言处理的效率和准确性

AI-ChatGPT教程

ChatGPT 技术架构分析、语料体系及训练算法与模型

GPT 爆发背后：自然语言处理的 20 年动荡

让GPT给我做自我介绍是种怎样的体验

chatgpt-java-main.rar

科技专题研究：AI大模型开启新一轮大国竞争，半导体战略地位凸显.pdf

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

斯坦福大学：2024年人工智能（AI）指数报告

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

2023泛娱乐社交出海手册-ZEGO即构科技

4个亲测好用的ChatGPT4渠道

chrome-win64.zip

vb企业考勤管理系统(论文+源代码+开题报告+答辩PPT).rar

asp.net考勤管理系统设计(源代码+论文).rar

北森能力测评题库.zip

学术海报模板+论文科研+研究生

最新资源

ChatGPT商业版PHP源码：完整、美观，支付功能、绘画和对话应有尽有，非授权，无反弹顺便附送详细教程，让你get到技能满分