GPT4及ChatGPT相关应用梳理
证券研究报告行业动态报告
发布日期:2023年3月17日
本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请参阅最后一页的重要声明。
分析师:于芳博
yufangbo@csc.com.cn
SAC编号:S1440522030001
分析师:阎贵成
yanguicheng@csc.com.cn
SAC编号:S1440518040002
SFC 中央编号:BNS315
分析师:金戈
jinge@csc.com.cn
SAC编号:S1440517110001
SFC 中央编号:BPD352
核心观点
核心观点:3月15日 OpenAI发布多模态大模型GPT-4,其不仅在语言处理能力上提高,还具备对图像的理解和分析能力。
GPT-4商业化进程加快,开放API的同时还发布了在6个不同商业场景的应用落地。随后微软发布了震撼的微软365 Copilot,
极大提升office的生产力和交互方式。此前,ChatGPT就已经展示了强大的能力,在文字创造、人机交互、教育、影音、零售
等多场景落地应用。我们认为,多模态大模型已在多领域具有专家能力,未来将深度赋能千行百业,改变生产生活方式。
1. 2023年3月15日,OpenAI目前最强大的多模态预训练大模型GPT-4正式发布。其能够处理文本、图像两种模态的输入信息,
单次处理文本量是ChatGPT的8倍,GPT-4的表现大大优于目前最好的语言模型,同时在学术考试中的水平远超GPT3.5。这意
味着GPT-4不仅在学术层面上实现了模型优化与突破,同时也展现出了成为部分领域专家的能力。
2. GPT-4商业化进程加快。GPT-4在发布时便开放了其纯文本输入的API,这与GPT-3和GPT-3.5的滞后开放不同。同时,GPT-
4这次一起推出了6个商业场景的具体应用落地,在优化人机交互体验、提供专业服务、提升组织效能、文化传承与保护等方
面都展现了巨大的潜能,未来有望看到更多场景中的商业化拓展与落地。
3. ChatGPT已经刮起GPT生态狂潮。2023年3月1号,OpenAI基于GPT 3.5 Turbo模型开放了ChatGPT API。API收费模式为
0.002美元/1000tokens。相较于前一代开放接口GPT 3.5,性能更强的同时,价格下降90%,加速ChatGPT相关应用生态的发展。
4.应用百花齐放,创造新的生产方式。微软先后在搜索引擎Bing、企业服务平台Dynamic 365及开发者工具平台Power
Platform等接入 ChatGPT/GPT-4能力。微软还发布了震撼的Microsoft 365 Copilot,极大提升office的生产力和交互方式。与此
同时,在越来越多的企业宣布接入ChatGPT的能力,其中不乏一些已经取得优秀商业化的应用。如Jasper、Quizlet、Shop等,
在语言文字创造、人机交互、教育、绘画、影音、零售等多场景落地应用。
5. 我们认为以GPT4/ChatGPT为代表的预训练大模型是这一轮AI浪潮的重要革新,重点推荐关注海内外优秀应用落地情况,
AI芯片产业链等投资机遇。
oPtQqQmMmOvMsNsMmMpNoM6MaOaQmOrRtRpMkPpPpMeRqRuN9PnMsQxNpOxPMYrQyQ
目录
一、ChatGPT:从全民关注的爆款应用走向商业化开放,在多个场景中展现价值
二、GPT4:更强大的多模态大模型,带来更广泛的商业应用可能
1.1 AIGC商业化演进:重点产品时间线
资料来源: Sequoia ,中信建投
• 随着技术的快速进步,AI生成内容(AIGC)极大地解放了生产力,其广阔的应用场景及市场价值推动着其商业化的快速发展。
• 垂直领域快速落地,爆款产品不断推出。随着技术不断演进,尤其是Diffusion、Transformer和Clip等模型的提出,AIGC的商业化
在多个领域开始落地。其中代码生成、文本生成、图像生成、音视频/游戏等领域已有不少爆款级产品。
• 1)代码领域,基于OpenAI的Codex模型,Github推出的Copilot具备代码的生成、补全、建议等功能,用户量突破百万级别。
• 2)文本领域,ChatGPT目前已开放API接口,微软已经在Bing和Dynamic365等应用接入。3月份发布的多模态预训练大模型GPT-4
已开放纯文本API,在图片理解、推理和学术考试中展现了强大能力,未来将适用于更广泛的应用场景。
• 3)图像领域, Stable diffusion等文生图应用已突破千万级用户量,目前是商业模式最成熟的领域,国内也在积极布局。
• 4)音视频/游戏领域,起步较晚,对模型复杂度和算力要求更高,百度的文心一言大模型已经具备对视频生成的能力。
图:AIGC重点产品时间线
GPT-3
DALL-E2
Stable
Diffusion
DALL-E
Imagen
Video
Make-
a-vedio
Phenaki
Jasper.AI
Copy.ai
ChatGPT
Codex
代码
文本
图像
音视频
/3D/游戏
2020
2021
2022
4月
8月
10月9月 11月
Midjourney
7月
6月
Copilot
Code
Whisperer
三大AI绘图应用
支持模型
底层技术
2023
2月
Bard
3月
百度
文心一言
aiXcoder
Meena
科大讯飞
SMART-
TTS
2019
及更早
底
层
技
术
微软小冰
Stable
Diffusion 2
TabNine
Magic3D
OpenAI
Google
国产
其他
盗梦师
6pen
GPT- 4
处于测试阶段
Palm
2022年发布
2023.3开放api
1.2 ChatGPT开放接口, OpenAI商业化进一步推进
• OpenAI开放ChatGPT API和Whisper API(应用程序接口),允许开发者将ChatGPT集成至他们的应用程序和服务中。
• 2023年3月1号,OpenAI宣布开放了ChatGPT API,其由自然语言大模型“GPT 3.5 Turbo” 支持,开放的API收费模式为
0.002美元/1000tokens,较前一代价格下降90%。
• OpenAI根据API调用的token(分词)输入和输出总数计费。例如调用输入10个token ,输出20个token,则需要支付30
个token的费用。同时token总数还需低于模型最大限制,GPT-3.5-turbo-0301版本的限制是4096个token。
• 除此之外,本次OpenAI还开放了Whisper API。是一种语音转换文字(speech to text)的模型,可以转写或翻译语音,
支持包括英语、中文、阿拉伯语、日语、德语、西班牙语等几十种语言,使用Whisper API的费用为每分钟0.006美元。
• 目前OpenAI已经开放了包括ChatGPT API和Whisper API在内的多个API接口,逐步推进商业化进程:
OpenAI开放的语言类API包括用于对话的GPT-3.5-turbo(多段对话)、InstructGPT(一问一答),其中InstructGPT根据其
性能可以分为Ada、Babbage、Curie、Davinci(由弱至强),这四个模型还提供针对具体场景的微调接口,其中的Ada还可
以作为研究的基础Embedding模型被调用。开放的多模态模型为Dall·E,根据处理图像的像素不同进行收费。开放的音频模
型为Whisper。
表:OpenAI开放的相关模型
资料来源:
OpenAI
,中信建投
应
用
具体
功能
模型名
定价
(美金/1000tokens
)
语
言
模
型
对话
GPT-3.5-turbo
0.002
Instruct
GPT
Ada 0.0004
Babbage
0.0005
Curie 0.0020
Davinci
0.0200
应用
具体
功能
模型名 定价(美金/1000tokens)
语言
模型
Fine
-
Tuning
Ada
0.0004(训练)
0.0016(调用)
Babbage
0.000
6
(训练)
0.0024(调用)
Curie
0.00
30
(训练)
0.0120(调用)
Davinci
0.0
300
(训练)
0.12
(调用)
Embedd
ing
Ada 0.0004
应用
具体
功能
模型名 定价
多模
态模
型
文生
图
Dall·E
0.020美金/ image
(1024×1024)
0.018美金/ image
(512×512)
0.016美金/ image
(256×256)
音频
模型
语音
识别
Whisper
0.006美金 / minute