融合特征编码的面部表情编辑技术.docx_脸部特征编辑资源-CSDN文库

版权申诉

41 浏览量 2022-12-15 14:21:49 上传评论收藏 356KB DOCX 举报

资源推荐

资源详情

资源评论

人脸表情生成技术是人工智能研究领域的热点之一，由于不同人种之间脸部轮廓和不

同年龄段人群皮肤纹理存在差异等问题，给生成真实感的人脸表情任务带来很大的挑战。

面部角度、光线、复杂的背景环境都会给生成效果带来影响。

传统的表情生成方法有多种，表情渐变技术使用几何或参数插值方式在同一个人两幅

不同表情之间进行控制面部表情

[1-2]

，插值的帧间形变函数根据表情任务的复杂度确定，线

性插值由于简单而被广泛使用。然而，在实际应用中，通常会存在不同人之间表情转换的

需求，表情映射法可实现任意人物不同表情的合成，一般的表情映射需要两个人物的中性

表情，获取同一个人的中性表情和目标表情的特征差值作用到特定的中性人脸表情上

[3]

，

该方法仅解决了新表情的生成，忽略了表情转化引起皮肤的纹理变化，使生成的图像缺少

真实感。二维网格法综合考虑了这两个方面，头部的几何信息抽象出由三角形组成的网格

结构，并用参数化模型表示，改变表情肌肉群对应的三角顶点位置参数合成新的表情。同

时，为了完成皮肤细节的变化，对改变后的图像像素进行重新分配

[4]

。

随着计算机硬件条件的提高，使用大规模参数运算的深度学习变为流行，2014 年文献

[5-6]提出了生成对抗网络(generative adversarial networks, GAN)，使生成对抗网络在深度学

习领域掀起了热潮，图像域间的转换、脸部外观改变等高质量图像的生成技术出现。与只

考虑特定外观修饰的面部属性编辑相比，面部表情编辑是一项更具挑战性的任务，因为它

通常涉及较大的几何变化，需要同时修改多个面部成分。

目前生成离散的面部表情模型居多，这些网络基本可完成面部属性变化的任务

[7-9]

。

IcGAN 利用两个 Encoder 网络分别对输入图像提取头部基本特征向量和属性特征

[10]

，将头

部属性特征向量对应位置的特征值进行 0-1 转换，使其转换为目标向量。再与基本特征向

量串联输入到生成网络 IcGAN。在生成离散表情领域里，StarGAN 是最成功的框架，可生

成多属性的高清人脸图像。该网络把表情作为其中一个目标属性域，使用单个生成器学习

多领域图像之间映射关系

[11]

。由于 StarGAN 在属性标签的基础上完成图像生成，生成的目

标表情受数据集表情标签限制，在数据集注释粒度定义的离散属性中改变面部一个特定的

部分，在表情方面只能渲染离散的情绪类别。

在实际的应用中，希望模型可合成任意表情，然而表情幅度可控的高质量图像生成研

究较少

[12-14]

，ExprGAN 是第一个基于 GAN 模型且将允许连续地控制表情强度，该模型能

够分离地学习身份特征和表情表示，但每种表情仅允许 5 个固定强度变化

[15]

。G2-GAN 使

用面部几何(基准点)作为可控制条件来指导具有特定表情的面部纹理合成，一对生成性对

抗性子网络被联合训练做相反的任务：表情移除和表情合成。成对的网络在无表情人脸和

表情人脸之间之间形成一个映射循环，能很好地捕捉表情变化引起的面部纹理的变化，合

成不同强度的表情

[16]

。GANimation 算法能够在一个连续的区域内生成具有解剖学意义的更

广泛的表情，无需预先计算输入图像中面部标志点的位置

[17]

，通过编码脸部肌肉运动单元

AU(action unit)，调节脸部某些区域肌肉运动强度，从而实现复杂的面部表情合成。但是，

该模型容易在表情密集区域产生伪影和模糊，提取的特征还原不到位，表情操控能力相对

较弱，存在生成图像达不到目标表情要求的问题。

剩余14页未读，继续阅读

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3675
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip