大语言模型介绍
技术简介
大语言模型是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解
语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是
通向人工智能的一条重要途径。
发展历史
2020 年 9 月,OpenAI 授权微软使用 GPT-3 模型,微软成为全球首个享用 GPT-3 能力
的公司。2022 年,Open AI 发布 ChatGPT 模型用于生成自然语言文本。2023 年 3 月 15
日,Open AI 发布了多模态预训练大模型 GPT4.0。
2023 年 2 月,谷歌发布会公布了聊天机器人 Bard,它由谷歌的大语言模型 LaMDA 驱
动。2023 年 3 月 22 日,谷歌开放 Bard 的公测,首先面向美国和英国地区启动,未来逐步
在其它地区上线。
2023 年 2 月 7 日,百度正式宣布将推出文心一言,3 月 16 日正式上线。文心一言的
底层技术基础为文心大模型,底层逻辑是通过百度智能云提供服务,吸引企业和机构客户
使用 API 和基础设施,共同搭建 AI 模型、开发应用,实现产业 AI 普惠。