基于CNN和HOG双路特征融合的人脸表情识别.docx_CN和HOG的特征融合资源-CSDN文库

版权申诉

58 浏览量 2022-11-03 16:11:36 上传评论 1 收藏 539KB DOCX 举报

资源推荐

资源详情

资源评论

0 引言

人的情感在很大程度上都是由面部表情来呈现，面部表情是非语言交际的一种形式，它是表达人与

人之间社会信息的主要手段之一，甚至还包含了语言所无法表达的重要信息.1978 年，Ekman 和

Friesen

[1]

系统地建立了人脸表情库，细致地描述了每一种表情所对应的面部变化，包括眉毛、眼睛、眼

睑、嘴唇等面部单元的变化，随后他们进一步定义了人类的 6 种基本表情：生气(Angry)、厌恶

(Disgust)、恐惧(Fear)、高兴(Happy)、悲伤(Sad)和惊讶(Surprise).

近年来，随着深度学习

[2]

迅速发展，神经网络在图像处理中的应用

[3]

越来越广泛，人脸表情识别

[4-5]

也逐渐成为一个活跃的研究领域.很多学者对该问题进行了研究，Perveen 等

[6]

采用基尼系数进行表情识

别，该方法通过计算面部轮廓点与眼睛之间的相对距离来区分不同表情，但该方法对于变化不明显的表情

识别率较低.Teixeira 等

[7]

提出了一种简单的表情识别解决方案，它采用了卷积神经网络和特定的图像预处

理步骤，在指定的特征集上获得了较好的识别精度，虽然该方法提取的特征丰富，但容易受到人为因素的

干扰.Mayya 等

[8]

提出了一种利用深度卷积神经网络(DCNN)特征自动识别人脸表情的新方法，该模型着重

于从单个图像中识别个体的面部表情，由于使用通用图形处理单元(GPGPU)，大大缩短了特征提取时

间.Li 等

[9]

提出了一种新的深度局部保留卷积神经网络(DLP-CNN)方法，它通过最大化类间离散度，保留

局部特性，最大限度地提高图像深度特征的识别能力.Yang 等

[10]

提出了一种基于双通道卷积神经网络的面

部表情识别方法，采用加权混合深度神经网络(WMDNN)自动提取有效特征，两个通道的输出以加权方式

融合，该算法针对六类面部表情识别精度较高，缺少对自然(Neutral)类表情的实验.Yao 等

[11]

提出了一种

基于 Wasserstein 生成对抗式网络的人脸图像生成网络以及表情识别网络，该方法通过在表情识别任务和

身份识别任务之间建立对抗关系来提取用户无关的表情特征并推断表情类别.但是，以上方法绝大部分都

是采用单一特征进行表情识别，输入特征可能会忽视部分细节信息，导致难以全面地表达人脸表情信息.

本文创新点在于针对单一数据难以全面表达表情特征的问题，提出了一种新的双路特征融合模型：

采用卷积神经网络(CNN)提取出丰富的隐式特征，利用方向梯度直方图(HOG)特征增强模型的稳定性和鲁

棒性，加入滑动窗口(sliding windows，SW)方法

[12]

进一步提高了网络模型性能.同时，为了更好地解决过

拟合问题，在卷积层和全连接层之间使用了 Dropout 技术

[13]

，随机抑制部分神经元的激活.为了解决梯度

消失的问题，在激活函数前加入批处理(batch normalization，BN)层，进一步提高了表情识别率.在模型测

试阶段，采用集成的方式减少异常值，进一步提高了准确率.实验表明了本文提出的双路特征融合模型在

人脸表情识别问题上的有效性.

1 表情数据库 1.1 FER2013 表情数据集

FER2013 表情数据库是由 Carrier 和 Courville

[14]

创建的，它是 ICML2013 面部表情识别挑战赛提供

的人脸表情数据库，由大小为 48×48 像素大小的人脸灰度图像构成.数据集中的人脸图像均经过居中处

理，并且人脸区域在每个图像中占据相同比例空间.

FER2013 数据库中的人脸表情均来自实际生活中的自然人脸表情，包含了 0~70 岁不同国籍、不同

肤色的面部表情，图 1 与图 2 中人脸图像没有经过对齐处理，有些标签不正确，有些样品甚至不包含人

脸.这种非摆拍、场景不固定、年龄跨度大的自然表情使得分类识别更具挑战性，因为这要求设计的模型

剩余11页未读，继续阅读

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3643
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip