没有合适的资源？快使用搜索试试~ 我知道了~

文库首页行业研究行业报告ChatGPT_InstructGPT详解.pdf

ChatGPT_InstructGPT详解.pdf

需积分: 5 0 下载量 36 浏览量 2023-09-01 16:14:36 上传评论收藏 1.99MB PDF 举报

温馨提示

试读

13页

ChatGPT_InstructGPT详解

资源推荐

资源详情

资源评论

ChatGPT专题|

ChatGPT/InstructGPT详解

前言

GPT系列是OpenAI的一系列预训练文章，GPT的全称是Generative Pre-Trained Transformer，

顾名思义，GPT的目的就是通过Transformer为基础模型，使用预训练技术得到通用的文本模型。

目前已经公布论文的有文本预训练GPT-1，GPT-2，GPT-3，以及图像预训练iGPT。据传还未发布

的GPT-4是一个多模态模型。最近非常火的ChatGPT和今年年初公布的[1]是一对姐妹模型，是在

GPT-4之前发布的预热模型，有时候也被叫做GPT3.5。ChatGPT和InstructGPT在模型结构，训

练方式上都完全一致，即都使用了指示学习（Instruction Learning）和人工反馈的强化学习

（Reinforcement Learning from Human Feedback，RLHF）来指导模型的训练，它们不同的

仅仅是采集数据的方式上有所差异。所以要搞懂ChatGPT，我们必须要先读懂InstructGPT。

1. 背景知识

在介绍ChatGPT/InstructGPT之前，我们先介绍它们依赖的基础算法。

1.1 GPT系列

基于文本预训练的GPT-1[2]，GPT-2[3]，GPT-3[4]三代模型都是采用的以Transformer为核心结

构的模型（图1），不同的是模型的层数和词向量长度等超参，它们具体的内容如表1。

图1：GPT系列的模型结构（其中Trm是一个Transformer结构）

表1：历代GPT的发布时间，参数量以及训练量

模型发布时间层数头数词向量长度参数量预训练数据量

GPT-1 2018 年 6 月 12 12 768 1.17 亿约 5GB

GPT-2 2019 年 2 月 48 - 1600 15 亿 40GB

GPT-3 2020 年 5 月 96 96 12888 1,750 亿 45TB

GPT-1比BERT诞生略早几个月。它们都是采用了Transformer为核心结构，不同的是GPT-1通过

自左向右生成式的构建预训练任务，然后得到一个通用的预训练模型，这个模型和BERT一样都可

用来做下游任务的微调。GPT-1当时在9个NLP任务上取得了SOTA的效果，但GPT-1使用的模型规

模和数据量都比较小，这也就促使了GPT-2的诞生。

剩余12页未读，继续阅读

评论收藏

内容反馈

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

safesmile

粉丝: 1
资源: 657

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

ChatGPT_InstructGPT详解.pdf

ChatGPT_InstructGPT详解.docx

ChatGPT_InstructGPT详解 - 知乎.pdf

ChatGPT-InstructGPT详解.pdf

linux_makefile_详解.pdf

无线射频识别_RFID_技术详解.pdf

sk_buff详解.pdf

ABS_Guide_cn_linux_shell详解 .pdf

compass_使用详解.pdf compass_教程 compass_试用案例

MYSQL_C_API详解.pdf

珠心算口诀表_全面详解.pdf

oracle参数open_cursors与session_cached_cursors详解.pdf

expdp+impdp_用法详解.pdf

ChatGPT_InstructGPT详解.zip

ChatGPT，InstructGPT详解

PBR_Guide_PBR详解_中文版.pdf

ChatGPT背后技术详解.zip

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

农村公交与异构无人机协同配送优化

李飞飞自传 我看见的世界 The World I see

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

4个亲测好用的ChatGPT4渠道

基于小波与卷积神经网络的多尺度时间序列分类.zip

学术海报模板+论文科研+研究生

北森能力测评题库.zip

最新资源

李飞飞自传我看见的世界 The World I see