来源:陈巍谈芯,本文将介绍ChatGPT的特点、功能、技术架构、局限、产业应用、投资机会和未
来。
作者:陈巍 博士,作者本人曾担任华为系自然语言处理( NLP )企业的首席科学家。
存算一体/GPU架构和AI专家,高级职称。中关村云计算产业联盟,中国光学工程学会专家,国际
计算机学会(ACM)会员,中国计算机学会(CCF)专业会员。曾任AI企业首席科学家、存储芯片
大厂3D NAND设计负责人,主要成就包括国内首个大算力可重构存算处理器产品架构(已在互联
网大厂完成原型内测),首个医疗领域专用AI处理器(已落地应用),首个RISC-V/x86/ARM平
台兼容的AI加速编译器(与阿里平头哥/芯来合作,已应用),国内首个3D NAND芯片架构与设
计团队建立(与三星对标),国内首个嵌入式闪存编译器(与台积电对标,已平台级应用)
ChatGPT专题
ChatGPT发展历程、原理、技术架构详解和产业未来
0,引言
先上参考网页或论文。专业的读者可以直接看paper。
ChatGPT: Optimizing Language Models for Dialogue ChatGPT: Optimizing Language Models
for Dialogue
GPT论文:Language Models are Few-Shot Learners Language Models are Few-Shot Learners
InstructGPT 论 文 : Training language models to follow instructions with human feedback
Training language models to follow instructions with human feedback
huggingface解读RHLF算法:Illustrating Reinforcement Learning from Human Feedback (RLHF)
Illustrating Reinforcement Learning from Human Feedback (RLHF)
RHLF 算 法 论 文 : Augmenting Reinforcement Learning with Human Feedback
cs.utexas.edu/~ai-lab/p
TAMER 框 架 论 文 : Interactively Shaping Agents via Human Reinforcement
cs.utexas.edu/~bradknox
PPO算法:Proximal Policy Optimization Algorithms Proximal Policy Optimization Algorithms
今年12月1日,OpenAI推出人工智能聊天原型ChatGPT,再次赚足眼球,为AI界引发了类似
AIGC让艺术家失业的大讨论。
据报道,ChatGPT在开放试用的短短几天,就吸引了超过 100 万互联网注册用户。并且社交网络
流传出各种询问或调戏ChatGPT的有趣对话。甚至有人将ChatGPT比喻为“搜索引擎+社交软件”
的结合体,能够在实时互动的过程中获得问题的合理答案。
ChatGPT 是一种专注于对话生成的语言模型。它能够根据用户的文本输入,产生相应的智能回
答。这个回答可以是简短的词语,也可以是长篇大论。其中GPT是Generative Pre-trained
Transformer(生成型预训练变换模型)的缩写。
通过学习大量现成文本和对话集合(例如Wiki),ChatGPT能够像人类那样即时对话,流畅的回
答各种问题。(当然回答速度比人还是慢一些)无论是英文还是其他语言(例如中文、韩语等),
从回答历史问题,到写故事,甚至是撰写商业计划书和行业分析,“几乎”无所不能。甚至有程序
员贴出了ChatGPT进行程序修改的对话。
ChatGPT也可以与其他AIGC模型联合使用,获得更加炫酷实用的功能。例如上面通过对话生成客
厅设计图。这极大加强了AI应用与客户对话的能力,使我们看到了AI大规模落地的曙光。
1,ChatGPT的传承与特点
1.1 OpenAI家族
我们首先了解下OpenAI是哪路大神。
OpenAI总部位于旧金山,由特斯拉的马斯克、Sam Altman及其他投资者在2015年共同创立,目
标是开发造福全人类的AI技术。而马斯克则在2018年时因公司发展方向分歧而离开。
此前,OpenAI 因推出 GPT系列自然语言处理模型而闻名。从2018年起,OpenAI就开始发布生
成式预训练语言模型GPT(Generative Pre-trained Transformer),可用于生成文章、代码、
机器翻译、问答等各类内容。
每一代GPT模型的参数量都爆炸式增长,堪称“越大越好”。2019年2月发布的GPT-2参数量为15
亿,而2020年5月的GPT-3,参数量达到了1750亿。
GPT家族主要模型对比
1.2 ChatGPT的主要特点
ChatGPT 是基于GPT-3.5(Generative Pre-trained Transformer 3.5)架构开发的对话AI模
型,是InstructGPT 的兄弟模型。ChatGPT很可能是OpenAI 在GPT-4 正式推出之前的演练,或
用于收集大量对话数据。
ChatGPT的主要特点
OpenAI使用 RLHF(Reinforcement Learning from Human Feedbac,人类反馈强化学习)
技术对 ChatGPT 进行了训练,且加入了更多人工监督进行微调。
此外,ChatGPT 还具有以下特征:
1)可以主动承认自身错误。若用户指出其错误,模型会听取意见并优化答案。
2)ChatGPT 可以质疑不正确的问题。例如被询问 “哥伦布 2015 年来到美国的情景” 的问题
时,机器人会说明哥伦布不属于这一时代并调整输出结果。
3)ChatGPT 可以承认自身的无知,承认对专业技术的不了解。
4)支持连续多轮对话。
与大家在生活中用到的各类智能音箱和“人工智障“不同,ChatGPT在对话过程中会记忆先前使用
者的对话讯息,即上下文理解,以回答某些假设性的问题。ChatGPT可实现连续对话,极大的提升
了对话交互模式下的用户体验。
对于准确翻译来说(尤其是中文与人名音译),ChatGPT离完美还有一段距离,不过在文字流畅度
以及辨别特定人名来说,与其他网络翻译工具相近。
由于 ChatGPT是一个大型语言模型,目前还并不具备网络搜索功能,因此它只能基于2021年所拥
有的数据集进行回答。例如它不知道2022年世界杯的情况,也不会像苹果的Siri那样回答今天天气
如何、或帮你搜索信息。如果ChatGPT能上网自己寻找学习语料和搜索知识,估计又会有更大的突
破。
即便学习的知识有限,ChatGPT 还是能回答脑洞大开的人类的许多奇葩问题。为了避免ChatGPT
染上恶习, ChatGPT 通过算法屏蔽,减少有害和欺骗性的训练输入。,查询通过适度 API 进行过
滤,并驳回潜在的种族主义或性别歧视提示。
2,ChatGPT/GPT的原理
2.1 NLP
NLP/NLU领域已知局限包括对重复文本、对高度专业的主题的误解,以及对上下文短语的误解。
对于人类或AI,通常需接受多年的训练才能正常对话。NLP类模型不仅要理解单词的含义,还要理
解如何造句和给出上下文有意义的回答,甚至使用合适的俚语和专业词汇。
NLP技术的应用领域
本质上,作为ChatGPT基础的GPT-3或GPT-3.5 是一个超大的统计语言模型或顺序文本预测模
型。
2.2 GPT v.s.BERT
与BERT模型类似,ChatGPT或GPT-3.5都是根据输入语句,根据语言/语料概率来自动生成回答的
每一个字(词语)。从数学或从机器学习的角度来看,语言模型是对词语序列的概率相关性分布的
建模,即利用已经说过的语句(语句可以视为数学中的向量)作为输入条件,预测下一个时刻不同
语句甚至语言集合出现的概率分布。