文章目录
AI 大模型是什么
AI 大模型发展历程
AI 大模型的底层原理
AI 大模型解决的问题
大模型的优点和不足
影响
个人观点
AI 大模型是什么
AI 大模型是指具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数。这些
模型可以通过学习大量的数据来提高预测能力,从而在自然语言处理、计算机视觉、自主驾
驶等领域取得重要突破。
AI 大模型的定义具体可以根据参数规模来分类。根据 OpenAI 的分类方法,可以将 AI 模型
分为以下几类:
小型模型: ≤ 1 百万个参数
中型模型:1 百万 – 1 亿个参数
大型模型:1 亿 – 10 亿个参数
极大型模型:≥ 10 亿个参数
其中大型模型和极大型模型可以被视为 AI 大模型。总的来说,“大模型”应该是基于具有超
级大规模的、甚至可以称之为“超参数”的模型,需要大量的计算资源、更强的计算能力以及
更优秀的算法优化方法进行训练和优化。
AI 大模型发展历程
2022 年 11 月 30 日由总部位于旧金山的 OpenAI 推出 ChatGPT3.5。
2023 年 2 月, Google 推出类似于 ChatGPT 的对话人工智能服务 Bard, 基于其开发的对
话编程语言模型(LaMDA)。但有很多限制,文字处理仅支持美式英语。
2023 年 3 月 12 日,OpenAI 发布多模态模型 GPT-4,并计划推出图像输入功能。
2023 年 2 月, 百度也于确认类 ChatGPT 聊天机器人项目名字确定为"文心一言", 英文名
ERNIE Bot。
2023 年 2 月, 复旦大学自然语言处理实验室邱锡鹏教授团队推出对话式大型语言模型
MOSS。
2023 年 3 月 14 日,由清华技术成果转化的公司智谱 AI 基于 GLM-130B 千亿基座模型的
ChatGLM 开启邀请制内测,同时开源了中英双语对话模型 ChatGLM-6B,支持在单张消费级
显卡上进行推理使用。
2023 年 4 月 7 日,阿里云研发语言模型“通义千问”开始邀请用户测试体验。现阶段该模型
主要定向邀请企业用户进行体验测试,获得邀请码用户可通过官网参与体验
2023 年 5 月 6 日,科大讯飞发布认知大模型“星火”。科大讯飞董事长刘庆峰表示,当前讯
飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超 ChatGPT,10 月
底将整体赶超 ChatGPT。
2023 年 3 月,由前 OpenAI 员工共同创立的初创公司 Anthropic 推出了大型语言模型 Claude。
它可以被指示执行一系列任务,包括搜索文档,总结,写作和编码,以及回答有关特定主题
的问题。
2023 年 3 月, 华为宣布即将推出盘古大模型。