虚拟数字人深度产业报告量子位2021.pdf资源-CSDN文库

版权申诉

交通工程

43 浏览量 2022-12-20 15:51:18 上传评论收藏 908KB PDF 举报

资源推荐

资源详情

资源评论

虚拟数字人

深度产业报告

技术背景篇

定义、关键词、分类、技术细节

市场规模、发展阶段、细分场景及判断、产业链、竞争格局、中外对比、产业瓶颈

产业现状篇

量子位硬科技深度产业报告—虚拟数字人

技术背景

虚拟数字人指存在于非物理世界中，由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用，并具有多

重人类特征（外貌特征、人类表演能力、人类交互能力等）的综合产物。市面上也多将其称为为虚拟形象、虚拟人、数字人等，代表性

的细分应用包括虚拟助手、虚拟客服、虚拟偶像/主播等。

1.1 定义

人 — 在外表、行为、交互行为等方面高度拟人化，外在表现和交互效果已成为核心发展路线

外表：

虚拟数字人的面部长相和整体形象。会受到虚拟数字人类别（如直接借用真人形象、高保真建模、风格化）、制作细节（对汗毛、皮肤、头发

等细节的建模）、渲染水平、设计审美等影响

行为：

虚拟数字人的面部表情、形体表达、语音表述等。会受到驱动方式（真人驱动、计算驱动、预制调节等）、驱动模型类别（精细面部肌肉驱动、

语音合成模型中对语气词、韵律的处理等）、训练数据、驱动模型精度等影响

交互：

虚拟数字人与现实世界的交互水平，包括回答内容、肢体反应等，会受到语音识别能力、自然语言理解及处理水平、知识图谱、预先设置知识

库等影响。

虚拟—存在于非物理世界中，不同场景实现难度不同

目前，虚拟数字人主要以图片、视频、实时直播、实时动画等方式存在于电子屏中，如APP、小程序、软硬一体显示设备。在未来，VR设备

与全息投影也将成为其重要存在方式。

需注意的是，尽管其存在方式均在非物理世界中，由于各场景所需的时延（如直播等实时场景要求低时延，但内容生成场景无该要求）、驱动

方式（计算驱动对模型的深度学习能力有极高要求）等不同，对技术、运营等要求差异较大。

数字—依托多项技术存在，相关技术成熟成为其发展重要推动力

虚拟数字人是典型的多技术综合产物。除CG建模+真人驱动的类别外，多模态技术与深度学习成为其核心点。该部分将在技术中详细展开。

多位从业人员认为，虚拟数字人近年的发展来源于CG（Computer Graphics，利用计算机进行视觉设计和生产）、语音识别、图像识别、动

捕等相关技术的共同成熟。

英雄联盟 Seraphine

风格化

三星 Neon

基于真人采集

Unreal Engine Metahuman Creator

高保真建模

Genies 基于真人明星的虚拟数字人

风格化

其具体特征可拆分为“虚拟”、“数字”及“人”三个部分。在试用了相关产品后，我们认为，“人”是其中的核心的因素。高度拟人

化为用户带来的亲切感、关怀感与沉浸感是多数消费者的核心使用动力。能否提供足够自然逼真的相处体验，将成为虚拟数字人在各个

场景中取代真人，完成语音交互方式升级的重要标准。

UneeQ 虚拟助手

相芯科技虚拟客服

魔珐科技漫画IP齐麟虚拟直播

搜狗&新华社虚拟主持人新小微

Source：UneeQ官网，相芯科技产品手册、魔珐科技产品手册、网络公开报道

量子位硬科技深度产业报告—虚拟数字人

真人驱动型技术流程

1. 形象设计及建模

基于IP设计或真人偶像绘制原画，进行面部及身体3D建模，选择关键点

2.建模绑定

将识别关键点映射至模型上，进行绑定。关键点绑定的数量及位置影响最终效果。

3. 表演捕捉

利用动作捕捉设备或特定摄像头+图像识别，捕捉在形体、表情、眼神、手势等方面的

关键点变化。

4. 驱动及渲染

真人演员（在虚拟偶像中称为中之人）根据制作需要进行相应表演，实时驱动虚拟数字

人表演。在较为精细的制作中，会需要根据真人演员和建模的区别进行重定向，并对动

作、眼神、手指等采用不同的驱动方式。

需要时需进行语音合成，形成特定设置语音

5.生成内容，进行互动

进行直播，或录制其动作生成内容

在计算驱动型中，虚拟数字人的语音表达、面部表情、具体动作将主要通过深度学习模型的运算结果实时或离线驱动，

在渲染后实现最终效果。

计算驱动的虚拟数字人最终效果受到语音合成（语音表述在韵律、情感、流畅度等方面是否符合真人发声习惯）、

NLP技术（与使用者的语言交互是否顺畅、是否能够理解使用者需求）、语音识别（能否准确识别使用者需求）等技

术的共同影响。尽管在特定方向上，各感知类技术已有的商业化能力已足以支撑，然而，但要达成理想的综合效果，

需要该公司在三个方面同时具有较强的综合能力。这也间接导致国内开展计算驱动型虚拟数字人业务的公司，大多是

在感知技术方面有较强的综合实力，相对成熟的AI技术公司。

计算驱动型技术流程

1. 设计形象。扫描真人形态及表演、采集驱动数据

利用多方位摄像头，对通用/特定模特进行打点扫描（视最终需求可进行全身或局部扫描），采集其说话时的唇动、表情、面部肌肉变化细节、姿态

等数据

从技术层面来看，虚拟数字人可以分为真人驱动型和计算驱动型。后者是近年来多模态技术和深度学习发展的技术集

大成者。

在真人驱动中，在完成原画建模和关键点绑定后，动捕设备或摄像头将基于真人的动作/表情等驱动虚拟数字人。

由于背后有真人操作，真人驱动型在动作灵活度、互动效果等方面有明显优势，一方面能够在影视内容的创作中减低

生产成本，为影视行业降低门槛，推动影视级内容向消费级转化。另一方面则多用于虚拟偶像、重要直播中，帮助虚

拟数字人完成大型直播、现场路演等互动性、碎片化活动。

事实上，这种技术思路可以看作是传统影视制作中，CG技术的进一步延续。近年来主要的技术突破在于动作捕捉环

节。随着图像识别技术，姿势、表情等识别算法的进步，昂贵的惯性或光学动捕设备不再是驱动的必备工具。普通摄

像头结合理想的识别算法通用能实现较为精准的驱动（如iPhone 12摄像头已可支持简单的动作捕捉），显著降低了

精细虚拟内容生成的门槛。

美国虚拟主播CodeMiko

采用真人驱动方法调整虚拟主播的动作及表情

1.2 技术细节

剩余17页未读，继续阅读

评论收藏

内容反馈

版权申诉

samLi0620

粉丝: 1642
资源: 1万+

虚拟数字人深度产业报告量子位 2021.pdf

最新资源

虚拟数字人深度产业报告 量子位 2021.pdf

数字虚拟人产业发展专题研究报告.pdf

【中国传媒大学&头号偶像】2021中国虚拟数字人影响力指数报告.pdf

中国虚拟数字人影响力指数报告（2021）.pdf

产业数字化厂商全景报告2021.4（62页）.pdf

量子位：AI生成内容产业展望报告.pdf

虚拟人行业研究报告 2022.pdf

量子位虚拟数字人白皮书.pdf

科技行业2021数字前沿应用趋势：变量.pdf

元宇宙发展五阶段和产业形态五大特征.pdf

浅析电子信息工程的现状和未来展望.pdf

计算机多媒体应用与发展趋势的研究文献综述.pdf

腾讯研究院 2021数字科技前沿应用趋势.pdf

人脑 机器人=.pdf

20210122-腾讯研究院-科技行业2021数字前沿应用趋势：变量.pdf

计算机科学前沿技术心得.pdf

虚拟现实技术应用场景中虚拟与真实边界的研究.pdf

元宇宙专题深度--未来的未来.pdf

关于通信技术与计算机技术融合技术的探讨.pdf

2022年十大数字科技前沿应用趋势（42页）.pdf

中关村重点产业领域 - 中关村科技园区.pdf

人工智能技术及其发展趋势,2020年公需课考试答案.pdf

未来城市：智慧城市进化之道.pdf

2022年中国元宇宙产业系列研究报告-基础设施篇（1）：5G与6G应用解析短报告.pdf

信息服务行业：英伟达2021GTC大会：坚定投入AI 打造智能世界的底座.pdf

计算机技术发展趋势,及其各种计算机技术的介绍.pdf

2022年十大数字科技前沿应用趋势.pdf

2020专技公需课人工智能技术以及其发展趋势.pdf

Gartner：2017年新兴技术成熟度曲线.pdf

GTC21-Jensen-Huang-Keynote-04.pdf

2030+技术趋势白皮书.pdf

最新资源

虚拟数字人深度产业报告量子位 2021.pdf

人脑机器人=.pdf