【免费】ChatGPT原理解析资源-CSDN文库

共1个文件

docx：1个

需积分: 0 69 浏览量 2023-04-18 17:09:46 上传评论 1 收藏 128KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

package

ChatGPT原理解析.docx.zip （1个子文件）

ChatGPT原理解析.docx 129KB

ChatGPT 原理解析

在 ChatGPT 发布之初，我同许多 AI 从业者一样对这

个被媒体号称要取代搜索引擎的聊天机器人产品是持

怀疑态度的，但在深度体验之后，发现 ChatGPT 跟

以往昙花一现的产品并不一样，它对于回答成熟的知

识确实已经大有替代搜索引擎的能力，而其对上下文

层层递进的连续交互能力简直颠覆了人们对大语言模

型能力的想象。

尽管 OpenAI 没有公布 ChatGPT 的论文和相关的训

练和技术细节，但我们可以从其兄弟模型

InstructGPT 以及网络上公开的碎片化的情报中寻找

到实现 ChatGPT 的蛛丝马迹。根据 OpenAI 所言，

ChatGPT 相对于 InstructGPT 的主要改进在于收集

标注数据的方法上，而整个训练过程没有什么区别，

因此，可以推测 ChatGPT 的训练过程应该与

InstructGPT 的类似，大体上可分为 3 步：

1.预训练一个超大的语言模型；

2.收集人工打分数据，训练一个奖励模型；

3.使用强化学习方法微调优化语言模型。

预训练一个超大的语言模型

从 GPT/Bert 开始，预训练语言模型基本遵循这样一

个两段式范式，即通过自监督方式来预训练大模型。

然后再在此基础上，在下游具体任务上进行

fine-tuning（微调）。其中 GPT 因为用的是单向

Transformer 解码器，因此偏向于自然语言生成，而

Bert 用的是双向 Transformer 编码器，因此偏向于自

然语言理解。因为 Bert 的及时开源和 Google 在业界

的强大影响力，外加业务导向的 AI 应用公司寄希望的

快速落地能力，那个时候绝大多数的从业者都更加看

好 Bert，哪怕是 openai 发布的 GPT2 也是反响平平，

这也为后来的落后埋下了伏笔。

这种两段式的语言模型，其 Capability（能力）是单

一的，即翻译模型只能翻译，填空模型只能填空，摘

要模型只能做摘要等等，要在实际任务中使用，需要

各自在各自的数据上做微调训练，这显然很不智能，

为了进一步向类似人类思维的通用语言模型靠齐，

GPT2 开始引入更多的任务进行预训练，这里的创新

之处在于它通过自监督的模型来做监督学习的任务。

经过这样训练的模型，能在没有针对下游任务进行训

练的条件下，就在下游任务上有很好的表现。也就是

说 Capability 有了较大的扩展，但此时的 Alignment

（对齐）还相对较弱，实际应用上还不能完全去除

fine-tuning，算是为 zero-shot leaning（零样本学习）

奠定了基础。为了解决 Alignment 问题，GPT3 使用

了更大的模型，更多的数据，并优化了 in-context

learning（上下文学习）的训练方式，即在训练时去拟

合接近人类语言的 Prompt(提示)，以指导模型它该做

些什么，这进一步提升了模型 zero-shot learning 的能

力，总而言之，语言模型在朝着越来越大的方向发展。

图 1 不同参数规模语言模型 zero-shot 效果对比

正如上面 GPT3 论文中的对比图所示，zero-shot 极度

依赖于大语言模型（LLM），可以说从 GPT3 开始的

语言模型的发展，已经与缺乏资源的普通人无关了，

自然语言处理的发展已经全面进入了超大语言模型时

代，但这并不影响我们去理解和借鉴其思想。

ChatGPT 也正是依赖于一个大规模的语言模型（LLM）

来进行冷启动的，具体过程如图 2 所示：

图 2 初始化预训练语言模型

显然，由于参与初始模型微调的人工生成数据量很少，

对于整个语言模型的训练数据而言是沧海一粟，因此

初始化语言模型时，这一步的微调对 ChatGPT 整体

而言大概是可有可无的。

尽管经过精心设计的 LLM 的 Capability 和 Alignment

均已达到非常好的水平，但是仅仅凭借预训练或加一

些监督文本微调得到的语言模型终究还是无法应对人

类所生活的真实语言环境的复杂性，这种模型在实际

应用中时长会暴露以下缺陷：

�

提供无效回答：没有遵循用户的明确指示，答非所问。

�

�

内容胡编乱造：纯粹根据文字概率分布虚构出不合理

的内容。

�

�

缺乏可解释性：人们很难理解模型是如何得出特定决

策的，难以确信回答的准确性。

内容反馈

程序员白城

粉丝: 167
资源: 88

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip