AI大模型,ChatGPT取得突破性进展,国内大模型争相发布-国信证券-2023.4.19-29页.pdf

preview
需积分: 0 13 下载量 29 浏览量 更新于2023-04-21 收藏 1.47MB PDF 举报
核心观点 大模型提升机器理解能力,优化人机交互方式。AI 大模型是实现通用人工智能 (AGI) 的重要方向,包含自然语言处理(NLP)、计算机视觉 (CV) ,多模态大模型等。ChatGPT 推出两个月 MAU 突破1亿,是自然语言处理领域突破性的创新,大力出奇迹后出现涌现能力,更理解人类语言。大模型“预训练+精调”即可对下游应用赋能。我们认为大模型优化人类与机器交互方式,是效率的革命。大模型是“大数据+大算力+强算法”结合的产物,对比国内外大模型,算力储备上国内并无短板:算法上 OpenAI 有先发优势:前期数据的丰富度和量对大模型的训练至关重要。 百度文心大模型:包含 NLP、CV 等在内的系列大模型。文心大模型包含 NLP大模型、CV 大模型、跨模态大模型、生物计算大模型、行业大模型等。与Bing 类似,文心一言有望优化C端用户搜索、创作体验;ToB 方面,百度已开放大模型 API 接口,在文案、AI 作画、开放域对话方面赋能企业。对于具体行业,百度推出文心行业大模型,以“行业知识增强”为核心特色。阿里巴巴通义大模型:由通义-M6 模型融合语言模型和视觉模型组成,率先应用在硬件终 **大模型概述** 大模型是人工智能发展中的一个重要里程碑,它们旨在提升机器的理解能力和优化人机交互方式。AI大模型涵盖了自然语言处理(NLP)、计算机视觉(CV)以及多模态等多个领域,旨在构建能够理解和处理复杂信息的通用智能系统。ChatGPT的出现,作为自然语言处理领域的重大突破,其在短短两个月内MAU超过1亿,显示了大模型在理解和生成人类语言方面的显著进步。这种进步不仅体现在基础的对话能力上,还表现在模型能够通过预训练和微调来赋能下游应用,提高效率。 **大模型的构建与工作原理** 大模型的成功依赖于“大数据+大算力+强算法”的结合。大数据提供了丰富的训练材料,大算力支持了模型的高效训练,而强算法则帮助模型从海量数据中学习到深层模式。在这一过程中,模型通常会经历预训练阶段,通过无监督学习捕捉通用的语言规律,然后进行微调,针对特定任务进行优化。 **国内大模型的发展** 1. **百度文心大模型**:百度推出的文心系列包含了NLP、CV等多个领域的大模型。其中,文心一言有望改善C端用户的搜索和创作体验,并通过API接口为B端企业提供文案、AI作画、开放域对话等服务。此外,百度还推出了行业大模型,以行业知识增强为特点,助力不同行业的智能化升级。 2. **阿里巴巴通义大模型**:通义模型融合了语言模型和视觉模型,已在硬件如天猫精灵和软件如通义千问中得到应用。通过统一底座M6-OFA和不同领域的专业模型,通义大模型提供了一系列功能,如拟声助手和对话式智能助手。 3. **腾讯混元大模型**:腾讯的混元模型利用热启动策略降低训练成本,表现出色,已在广告、游戏等多个场景实现落地,提高了工作效率。 4. **华为盘古大模型**:华为的盘古系列模型在物流、药物研发、气象预测等多个领域发挥作用。盘古CV大模型应用于物流仓库监控,NLP大模型用于智能文档检索,科学计算大模型则服务于气象预报等。 5. **字节跳动AI探索**:字节跳动在语言和图像大模型上进行了初步布局,计划推出AIGC大模型。目前,其模型已经用于图文、视频内容生成,飞书也将推出智能AI助手"My AI"。 **投资建议** 随着各大公司竞相投入大模型的研发,AI模型竞赛正日益激烈。投资者应关注那些在大模型领域有深厚技术积累的公司,如腾讯、阿里巴巴和百度。然而,也需注意潜在的风险,如技术迭代速度、应用落地速度、政策风险以及供应链风险。 AI大模型正逐渐改变人机交互的方式,带来效率的革命,国内企业在大模型领域展现出强大的竞争力,预示着中国在AI领域的持续创新和发展。未来,这些大模型将在更多场景中落地,推动各行各业的数字化转型。