近几年,人工智能技术领域高潮迭出,给我们引爆了一轮又一轮技术热潮,而刚
进入 2023 年,人工智能界就出现了“新顶流”—ChatGPT。它最近肯定在大家面
前疯狂刷屏,大家即使不了解它,也早就对这个名字耳熟能详了。那么它到底是
什么呢?丁磊博士在新书《生成式人工智能》中对 ChatGPT 进行了详细的解释。
ChatGPT 是什么?
其实 ChatGPT 是一个由 OpenAI 公司推出的大型语言模型(large language model,
LLM),它能帮助开发人员使用自然语言理解来增强聊天机器人和智能应用程序
的功能,可以处理各种任务,如撰写文章、提供建议、回答问题等。
自 2022 年 11 月推出后,ChatGPT 因其强大的功能爆红,用户数量暴增,仅 2
个月就达成了用户破亿的目标,成为史上用户最快破亿的应用。而达成这一目标,
TikTok 用了 9 个月,这足以说明 ChatGPT 的受欢迎程度了。
据美国杂志 PCMag 报道,谷歌曾经给 ChatGPT 提供了面试程序员的问题,结
果它不仅没被难倒,甚至还被判定为具备三级软件工程师的水准,简直让人瞠目。
目前,ChatGPT 已经开始入侵职场,根据职业咨询平台 ResumeBuilder.com 的
最新报告,在 1000 家企业调查样本中,49% 的企业目前正在使用 ChatGPT,
主要应用在协助招聘、编写编码等工作中。报告还称,从 2022 年 11 月 ChatGPT
上线后,不少企业已经将 ChatGPT 投入了应用,在这之中,有 48% 的企业开
始利用 ChatGPT 代替员工工作,25% 的企业已经通过 ChatGPT 节约了 75 000
美元以上的成本,这简直给部分岗位的工作者带来了失业的隐患!
ChatGPT 发展历程
如前所述,生成式 AI 通过学习数据中的联合概率分布,对已有的数据进行总结
归纳,再创作出新的内容。ChatGPT 作为一款自然语言处理模型,通过学习语料
中词汇之间的组合规律和逻辑,生成合理的接续,实现内容的创作。这类似一个
“接龙”的过程,ChatGPT 根据上文计算并生成下一个词,然后继续生成下面的词,
从而完成一句话或者长文,也就是“自回归生成”。因此,虽然训练 ChatGPT 使
用的语料都是现有的已经被创作出来的,但是其创作内容不是“抄袭”,不是简单
的复制和粘贴,而是在现有语料的基础上学习词与词之间的逻辑,创作出新的内
容。
ChatGPT 的能力并不是一蹴而就的,提到“神器”ChatGPT 的前世今生,那可有太
多故事了。其实 ChatGPT 的“前世”与 Transformer(变换器)模型关系紧密,由
于 Transformer 模型诞生于 2017 年,因此我们的故事得从 2017 年说起。
2017 年,谷歌大脑团队在神经信息处理系统大会发表了一篇名为《注意力是你
所需要的全部》(Attention Is All You Need)的论文。这篇论文的作者在文章中
第一次提出了一个基于注意力机制的 Transformer 模型,并且把这个模型首次用
在理解人类的语言上,这就是自然语言处理。谷歌大脑团队利用非常多已经公开