没有合适的资源?快使用搜索试试~ 我知道了~
2019年中国人工智能基础数据服务行业白皮书1
需积分: 0 0 下载量 101 浏览量
2022-08-03
12:43:10
上传
评论
收藏 3.67MB PDF 举报
温馨提示
试读
43页
摘要来源:艾瑞自主研究绘制。随着算法需求越来越旺盛,依赖人工标注不能满足市场需求,因此增强数据处理平台持续学习能力,由机器持续学习人工标注,提升预标注和自动标注
资源详情
资源评论
资源推荐
中国人工智能基础数据服务
行业白皮书
2019年
2
©2019.8 iResearch Inc. www.iresearch.com.cn
摘要
来源:艾瑞自主研究绘制。
随着算法需求越来越旺盛,依赖人工标注不能满足市场需求,因此增强数据处理平
台持续学习能力,由机器持续学习人工标注,提升预标注和自动标注能力对人工的
替代率将成趋势。远期,越来越多的长尾、小概率事件所产生的数据需求增强,机
器模拟或机器生成数据会是解决这一问题的良好途径,及早研发相应技术也将成为
AI基础数据服务商未来的护城河。
在经历了一段时期的野蛮生长之后,人工智能基础数据服务行业进入成长期,行业
格局逐渐清晰。人工智能基础数据服务方的上游是数据生产和外包提供者,下游是
AI算法研发单位,人工智能基础数据服务方通过数据处理能力和项目管理能力为其
提供整体的数据资源服务,不过AI算法研发单位和AI中台也可提供一些数据处理工
具,产业上下游普遍存在交叉。
数据安全、采标能力、数据质量、管理能力、服务能力等仍是需求方的痛点,需要
人工智能基础服务商有明确具体的安全管理流程、能够深入理解算法标注需求、可
提供精力集中且高质量的服务、能够积极配合、快速响应需求方的要求。
2018年中国人工智能基础数据服务市场规模为25.86亿元,其中数据资源定制服务
占比86%,预计2025年市场规模将突破113亿元。市场供给方主要由人工智能基础
数据服务供应商和算法研发单位自建或直接获取外包标注团队的形式组成,其中供
应商是行业主要支撑力量。
SMS
3
序言
算法、算力、数据是人工智能发展的三大要素,人工智能已经从讲技术教育市场的阶段,
过渡到思考如何将技术与商业相结合落地的阶段,而数据作为AI算法的“燃料”,是实现
这一能力的必要条件,因此,为机器学习算法训练提供数据采集、标注等服务的人工智能
基础数据服务成为近年人工智能热潮中必不可少的一环。
2018年1月,由国务院办公厅发布的《科学数据管理办法》中,明确了科学数据的责任、
安全使用和共享利用等行为规范,政策层面的关注表明,科学数据是国家科技创新发展和
经济社会发展的重要基础性战略资源,科技创新越来越依赖于大量、系统、高可信度的科
学数据。
当人工智能技术在更多场景尝试下沉时,AI基础数据服务将迎来挑战,新兴垂直场景数据
既难以获取,又需要有经验、有专业素养的人员进行标注,考验着从业玩家的研发、管理、
培训能力,但也同样伴随着机遇。
人工智能基础数据服务并非人们想象中的数据作坊,其发展依赖于基于技术的数据处理平
台和工具,以及科学高效的管理。该赛道还是科技巨头早早布局的“逐鹿场”。以百度为
代表的巨头企业纷纷建设数据采集与标注服务团队,在支撑自身人工智能技术研发的同时,
对外输出数据采标能力,成为行业领先力量。随着高难度、前沿独特性需求渐成主流,数
据服务行业早期鱼龙混杂的现象将改变,优势公司实力将逐渐凸显。
——艾瑞咨询研究院
4
人工智能基础数据服务行业概述
1
人工智能基础数据服务市场现状
2
人工智能基础数据服务场景分析
3
人工智能基础数据服务需求分析
4
人工智能基础数据服务发展趋势与建议
5
5
©2019.8 iResearch Inc. www.iresearch.com.cn
人工智能基础数据服务定义
意指为AI算法训练及优化提供数据采集和标注等形式的服务
人工智能基础数据服务指为AI算法训练及优化提供的数据采集、清洗、信息抽取、标注等服务,以采集和标注为主。人工
智能概念爆发伊始,算法、算力、数据就作为最重要的三要素被人们乐道,进入落地阶段,智能交互、人脸识别、无人驾
驶等应用成为了最大的热门,AI公司开始比拼技术与产业的结合能力,而数据作为AI算法的“燃料”,是实现这一能力的
必要条件,因此,为机器学习算法训练、优化提供数据采集、标注等服务的人工智能基础数据服务成为了这一人工智能热
潮中必不可少的一环。如果说计算机工程师是AI的老师,那基础数据服务就是老师手中的教材。
来源:艾瑞根据公开资料自主研究绘制。
实现途径
算
力
传统通
用计算
(CPU)
AI计算架构
AI芯片
CPU+GPU TPU FPGA ……
智能设备 视觉 类脑 ……
自动驾驶 安防 物联网
支持系统
计算平台
硬件设备
云服务
储存设施
网络传输
数据采集
数据可视化
编程语言
算法平台
AI框架
量子计算
理论研究
基础层
应
用
层
技术层
数
据
数据存储
数据处理
数据挖掘
信息抽取
数据标注
数据采集
数据清洗
算
法
机器学习算法
监督式学习 非监督学习
半监督学习 强化学习
深度学习
迁移学习
……
早期算法
搜索式推理
专家系统
智能代理
……
计算机视觉
图像识别
人脸识别 视频识别
文字识别
视觉识别
步态识别
……
语音识别
声音识别
语音合成 语音交互
声纹识别
……
自然语言处理
信息理解
机器翻译 自然语言生成
文字校对
……
知识图谱
通用型
行业型
人工智能技术框架
AI基础数据服务
剩余42页未读,继续阅读
郑瑜伊
- 粉丝: 19
- 资源: 318
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0