GPT/GPT2/GPT3/ChatGPT 梳理
近年来,OpenAI 发布的 GPT-3 和 ChatGPT 模型相继破圈,很多行业
开始担心 AI 会在不久的将来会淘汰难度不大的工作岗位。虽然从专业
角度看,这些模型仍然存在不少问题需要很长时间才能攻克,但考虑到
大型语言模型的天花板仍然是个谜,谁也不能保证未来它是否会革命性
地改变人类生产力方式,而一旦成功,唯有实践家会取得先机,成为新
的 IT 巨头。所以当下科技巨头纷纷追赶,体现出其较高的商业价值和
技术价值。
本文将由浅入深地对 GPT 系列模型(包括
GPT/GPT2/GPT3/InstructGPT/ChatGPT)进行梳理和总结,并不定
期更新相关动态。
一、时间轴
� 2023 年 3 月,GPT4 已发布,该模型将引入多模态的能力;
� 2023 年 2 月,Microsoft Bing 浏览器引入 ChatGPT;复旦大学
发布 Moss,一时访问过大,服务宕机;Meta 发布 GPT3 竞品模型
LLaMA,参数相比要少很多,但并未彻底开源;
� 2022 年 11 月,OpenAI 发布 ChatGPT 博客;
� 2020 年 5 月,OpenAI 发布 GPT3;
� 2019 年 2 月,OpenAI 发布 GPT2 博客;