人脸表情识别
项目介绍
基于深度学习的人脸表情识别系统设计与实现
软件架构
软件架构说明
使用已有的公开数据集进行人脸表情识别模型的训练。还有常见的那些公开数据集比如
FER2013、CK+、JAFFE 这种,都是可以拿来做数据集的。这些数据集通常包含了大量的人
脸图像,每张图像都标注了相应的表情类别,上传一部分照片,自己给照片打上相应的标签。
对采集到的人脸数据进行标注,即为每张图像或视频帧打上相应的表情标签。标注工作可以
通过人工标注或者半自动标注工具来完成。对于已有的数据集或者采集到的数据,可以使用
数据增强技术来增加样本的多样性和数量。数据增强技术包括图像旋转、镜像翻转、亮度调
整。
Resnet(Residual Network)模型:一种深度残差网络结构,通过使用残差块(Residual
Block)解决了深度神经网络训练过程中的梯度消失和梯度爆炸问题。它在人脸表情识别等
领域取得了很好的效果。ResNet 由多个残差块组成,每个残差块包含多个卷积层和恒等映
射(Identity Mapping),通过跨层连接(Skip Connection)将输入和输出相加,保证了网络的
信息传递和梯度流动。
CNN(Convolutional Neural Network)模型:经典的卷积神经网络结构,由卷积层、池化层
和全连接层组成,通过卷积操作和池化操作提取图像的特征,并通过全连接层进行分类。简
单 CNN 结构简单、易于理解和实现,在人脸表情识别等任务中也取得了不错的效果。
Xeception 模型:Xception 是一种极端深度卷积神经网络结构,是 Google 提出的一种基于
Inception 架构改进的模型。Xception 采用了深度可分离卷积(Depthwise Separable Convolution)
替代传统的卷积操作,大大减少了模型参数和计算量,并提升了模型的性能。Xception 在人
脸表情识别等领域也有很好的应用。