没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
盘古大模型.md
2023-09-20
1 / 3
盘古大模型
大模型简介
大模型的由来可以追溯到2017年,随着Transformer结构的提出,深度学习模型参数突破了1亿。从Lenet、
Alexnet、ResNet等模型开始,深度学习的神经网络模型参数一个比一个大。后来,随着BERT网络模型的提
出,参数量首次超过3亿规模。接着,GPT-3模型超过百亿,鹏程盘古实现千亿稠密的规模,Switch
Transformer的问世还一举突破万亿规模。
现在常说的大模型之大,一般指内置的参数量数量级之大,比如GPT-3.5的1.75亿参数。大模型在各个领域都有
广泛的应用,例如语言模型、图像模型和视频模型等。大模型通过海量数据学习出一些隐藏其中的模式或规
律,进而对未来的数据进行预测或生成新数据。
随着大模型的快速发展和广泛应用,AI专家将大模型统一命名为Foundation Models,可以翻译为基础模型或者
是基石模型,论文肯定了Foundation Models对智能体基本认知能力的推动作用,同时也指出大模型呈现出“涌
现”与“同质化”的特性。所谓“涌现”代表一个系统的行为是隐性推动的,而不是显式构建的;“同质化”是指基础
模型的能力是智能的中心与核心,大模型的任何一点改进会迅速覆盖整个社区,但其缺陷也会被所有下游模型
所继承。
发展历史
盘古大模型是华为云推出的一种超大规模预训练模型,具有广泛的应用前景和实际应用价值。其发展历程从一
个侧面反映了人工智能技术的不断演进和完善。
盘古大模型的历史可以追溯到2020年11月,当时华为云在内部立项并完成了与合作伙伴、高校的合作搭建。在
2021年4月,盘古大模型正式对外发布,并在当年7月推出了NLP大模型和CV大模型。到了2023年3月,华为云
官网显示盘古系列AI大模型中的NLP大模型、CV大模型、科学计算大模型已经标记为即将上线状态。
在同年的7月,华为开发者大会上,华为常务董事、华为云CEO张平安宣布,华为云盘古大模型3.0正式发布。
盘古大模型3.0是一个完全面向行业的大模型,包含L0基础大模型、L1行业大模型及L2场景模型三层架构,主要
面向政务、金融、制造、医药、矿山、铁路、气象等行业。
华为云盘古大模型的NLP大模型在权威的中文语言理解评测基准CLUE榜单中,总排行榜及分类、阅读理解单项
均排名第一,刷新三项榜单世界历史纪录。此外,盘古CV大模型也被认为是业界首个超大规模的CV大模型,具
有多种应用场景。
盘古大模型的应用范围广泛,包括但不限于金融、制造、政务、电力、煤矿、医疗、铁路等各个行业。在这些
行业中,盘古大模型可以快速实现不同场景的适配,加速AI行业应用。同时,华为云还在不断升级和完善盘古
大模型的系列AI大模型,不断拓展其应用领域和适用范围。
整体介绍
盘古大模型是华为云推出的一系列超大规模预训练模型,包括但不限于NLP大模型、CV大模型、多模态大模
型、科学计算大模型等。这些大模型基于深度学习技术,将数据的分布和特征整合在一个具有巨大参数量的神
资源评论
韩楚风
- 粉丝: 1w+
- 资源: 93
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功