![](https://csdnimg.cn/release/download_crawler_static/87629568/bg1.jpg)
目前 ChatGPT 没有公布官方的论文,能得到的信息目前只有官方 blog 的简介,其中介绍到
ChatGPT 有个“兄弟”叫 InstructGPT,该模型已经发布论文,通过对比 ChatGPT 和 InstructGPT
两者模型的训练步骤,我们会发现两者的训练步骤高度相似(ChatGPT 将模型 GPT-3 优化至
GPT-3.5),具体如下图所示:
ChatGPT 训练原理
InstructGPT 训练原理
为帮助大家了解 ChatGPT 的原理,主要参考 InstructGPT 的相关论文,来帮助大
家理解 ChatGPT 是怎么被训练出来的。ChatGPT 模型学习的四个阶段:1、学习