没有合适的资源?快使用搜索试试~ 我知道了~
百度大脑AI技术成果白皮书-百度-201910.pdf
需积分: 0 8 下载量 160 浏览量
2019-11-07
14:47:01
上传
评论
收藏 6.23MB PDF 举报
温馨提示
试读
48页
百度大脑AI技术成果白皮书-百度-201910.pdf百度大脑AI技术成果白皮书-百度-201910.pdf
资源推荐
资源详情
资源评论
i
目录
引言 ......................................................................... 1
一、百度大脑进化到 5.0 ....................................................... 2
二、基础层 ................................................................... 3
2.1 算法 ................................................................... 3
2.2 算力 ................................................................... 5
2.3 数据 .................................................................. 10
三、感知层 .................................................................. 11
3.1 语音 .................................................................. 11
3.2 视觉 .................................................................. 13
3.3 增强现实/虚拟现实 ..................................................... 17
四、认知层 .................................................................. 19
4.1 知识图谱 .............................................................. 20
4.2 自然语言处理 .......................................................... 22
五、平台层 .................................................................. 27
5.1 飞桨(PaddlePaddle)深度学习平台 ...................................... 28
5.2 UNIT 智能对话训练与服务平台 ........................................... 32
5.3 开放数据集 ............................................................ 33
六、AI 安全 ................................................................. 35
结语与展望 .................................................................. 40
!
1
引言
回顾过去的一年,科技与商业发展的一个关键词就是“人工智能”。在近一年的时间
里,百度科学家和工程师们不仅在人工智能算法、核心框架、芯片、计算平台、量子计算、
语音技术、计算机视觉、增强现实与虚拟现实、语言与知识、开放平台、开放数据等诸多
方面取得了令人瞩目的技术成果,还将这些技术成果与行业相结合,成功应用于众多产品
之中,取得了丰硕的人工智能应用成果。
2019 年 2 月,世界知识产权组织(World Intellectual Property Organization,简称 WIPO)
发布了首份技术趋势报告,聚焦人工智能领域专利申请及发展状况。报告显示,百度在深
度学习领域的专利申请量位居全球第二,超越 Alphabet、微软、IBM 等企业和国外学术机
构,在全球企业中居于首位。
过去的一年,百度基础技术体系、智能云事业群组和 AI 技术平台体系进行了重大组织
机构调整,三个体系统一向集团 CTO 汇报,这为技术中台建设和人工智能技术落地提供了
良好的组织保障。
本报告总结了百度大脑在 2018-2019 年度取得的部分技术成果:第一章主要概述百度
大脑 5.0,第二至六章分别介绍百度大脑在基础层、感知层、认知层、平台层和安全方面
的技术成果。
面向未来,百度将继续打造领先的 AI 技术能力,构建更加繁荣的人工智能生态系统,
助力各行各业进入智能化的工业大生产阶段,在智能时代创造更广泛的社会经济价值。
2
一、百度大脑进化到
5.0
百度大脑是百度 AI 集大成者。百度大脑自 2010 年起开始积累基础能力,后逐步完善。
2016 年,百度大脑 1.0 完成了部分基础能力和核心技术对外开放;2017 年,2.0 版形成了
较为完整的技术体系,开放 60 多项 AI 能力;2018 年,3.0 版在“多模态深度语义理解”
上取得重大突破,同时开放 110 多项核心 AI 技术能力;2019 年,百度大脑升级为 5.0,核
心技术再获重大突破,实现了 AI 算法、计算架构与应用场景的创新融合,成为软硬件一体
的 AI 大生产平台。
如图 1 所示,百度大脑如今已形成了包括基础层、感知层、认知层、平台层以及 AI 安
全五大核心架构在内的技术布局。同时,安全一直都贯穿 AI 技术研发的始终,已经融合在
百度大脑的所有模块中。基于数据、算法和算力强大的基础能力支持,百度大脑拥有包括
语音、视觉、增强现实(AR)/虚拟现实(VR)以及语言与知识等技术能力,并通过 AI 平
台对外开放,形成以百度大脑为核心的技术和产业生态。
多年来,百度大脑支持百度几乎所有业务,并面向行业和社会全方位开放,助力合作
伙伴和开发者,加速 AI 技术落地应用,赋能各行各业转型升级,其核心技术及开放平台荣
获 2018 年度中国电子学会科技进步一等奖。
图 1 百度大脑
3
二、基础层
2.1
算法
百度持续在算法和理论方面深入研究,在语音、图像、语言与知识等多个领域取得重
大突破。
在语音识别方面,百度将注意力机制的建模技术用于在线语音识别,提出了流式多层
截断注意力模型 SMLTA,实现了流式的基于注意力机制的声学语言一体化建模,并在 2019
年初实现了基于该技术的大规模产品上线,大幅提升了语音识别产品在线识别准确率和用
户体验,相对准确率提升 15% 至 20% 。 该算法使用 CTC ( Connectionist Temporal
Classification)的尖峰信息对连续语音流进行截断,然后在每一个截断的语音小段上进行当
前建模单元的注意力建模。通过该方法把原来的全局整句 Attention 建模,变成了局部语音
小段的 Attention 建模。同时,为了克服 CTC 模型中不可避免的插入删除错误对系统造成的
影响,该算法引入一种特殊的多级 Attention 机制,实现特征层层递进的更精准的特征选择。
最终,这种创新建模方法的识别率不但超越了传统的全局 Attention 建模,同时还能够保持
计算量、解码速度等在线资源耗费和传统 CTC 模型持平。
图 2 流式多层截断注意力模型 SMLTA
在个性化语音合成方面,百度还提出了语音风格和音色迁移的个性化韵律迁移语音合
成技术 Meitron。该技术在训练时,交叉组合不同声音的训练样本,实现了声音的音色、
风格和情感的解耦。语音的个性化信息、风格信息和情感信息等沉淀到全局声音的基
剩余47页未读,继续阅读
资源评论
weixin_38746951
- 粉丝: 133
- 资源: 1133
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功