没有合适的资源?快使用搜索试试~ 我知道了~
基于增强卷积神经网络的尺度不变人脸检测方法.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 3 浏览量
2023-02-23
16:47:52
上传
评论
收藏 345KB DOCX 举报
温馨提示
试读
12页
基于增强卷积神经网络的尺度不变人脸检测方法.docx
资源推荐
资源详情
资源评论
0. 引 言
人脸检测作为面部信息处理的基础技术,被广泛的应用到人脸识别
[1]
、人脸跟踪
[2]
、
人脸特征点定位
[3]
和人脸属性分析
[4]
等任务,其检测结果直接影响后续步骤的精确性和稳健
性,具有重要的研究意义。人脸检测可分为约束场景下的人脸检测和非约束场景下的人脸
检测
[5]
,后者包含跨光谱
[6]
、多人密集环境
[7]
、局部遮挡
[8]
等多种复杂环境。由于约束场景
下的人脸检测较为简单,而非约束场景下的人脸检测受人脸尺度多样性、姿态多样性、遮
挡、模糊等条件影响比较困难,因此当前人脸检测的研究热点主要集中于非约束场景。
作为人脸检测的先驱,参考文献[9]提出了一种基于 Haar-like 特征和 AdaBoost 级联分
类器的人脸检测方法,取得了相对较好的检测效果,但其仍局限于人工设计特征的弱描述
能力。
在神经网络迅速发展的今天,研究人员已经开始使用更强特征描述能力的卷积神经网
络(Convolutional NeuralNeural NetworksNetworks, CNN)
[10-11]
来取代传统方法进行人脸
检测,并且在检测精度、速度和适应性等方面取得了较大的提高。比如 Cascade CNN
[12]
,
就是 AdaBoost 人脸检测方法的卷积神经网络实现,和传统方法相比,Cascade CNN 具有更
高的检测精度和速度。虽然基于 CNN 的人脸检测方法进一步提高了人脸检测的准确率,
但对非约束场景下的小尺寸人脸检测仍具难度。
基于卷积神经网络的人脸检测方法主要分为两种:第一种是两阶段人脸检测方法,先
在区域建议网络
[13]
(RegionRegion ProposalProposal Network, RPN)中经过端到端的训
练,再将训练得到的区域候选图送入到 Faster RCNN 进行分类和回归;另一种是源于单一
神经网络物体检测器(Single Shot MultiBox Detector, SSD)的人脸检测方法
[14]
,它不需要
进行候选区域的建议,直接在多尺度卷积层上执行人脸/背景人脸/背景分类和人脸边界框
位置回归。参考文献[15]提出了一种融合面部区域上下文信息的人脸检测方法,对小尺寸
人脸检测效果较好,但运算时效性低。参考文献[16]通过等比例补偿锚匹配策略提升对小
尺寸人脸的正样本分辨能力,通过 max-out 标签增强了人脸分类能力和检测准确度。参考
文献[17]提出了一种基于背景协作描述的单一神经网络人脸检测方法,通过扩大检测框的
感受野提高了对小尺寸人脸的检测精度。
文中基于 SSD 人脸检测模型,针对非约束场景下的小尺寸人脸检测,从以下 3 个方
面进行了改进:(1)提出了一种特征增强网络。在 SSD 基础检测网络的两个浅层特征图
上,通过协调聚合当前层特征图和前后两层特征图的特征信息,增强了当前层特征图的鉴
别性和稳健性,提高了对小尺寸人脸的检测精度。(2)对两个检测小尺寸人脸的增强特征
图,进行负样本筛选,通过增加分类的难度来降低由小尺寸锚框引起的人脸检测假正率升
高。(3)为增强特征图和原始特征图分别建立两种基于锚框尺寸的损失函数,并进行加权
融合。
1. 基于 SSD 的人脸检测模型
与先生成 RPN 再进行目标检测的算法不同,SSD 算法可直接预测目标类别和检测框
位置,具有较高的检测精度和很快的检测速度。该算法通过在不同尺度特征图上进行
3×33×3 尺寸的滑动卷积,可实现精度较高的尺度不变人脸检测结果。基于 SSD 基础检测
网络的人脸检测模型如图 1 所示。
图 1 基于 SSD 基础检测网络的人脸检测模型
Fig. 1 Face detection model based on SSD basic detection network
下载: 全尺寸图片 幻灯片
由图 1 可知,Conv1_1−Conv5_3Conv1_1−Conv5_3 是 VGG16VGG16 的前 5 个卷积
层,Conv6Conv6 和 Conv7Conv7 是由 VGG16VGG16 的 2 个全连接层 FC6 和 FC7 改造的
卷积层,Conv8_2−Conv11_2Conv8_2−Conv11_2 是新增的 4 个卷积层。该模型的输入是包
含一个或多个面部的图像,输出是一系列人脸检测框及其对应的面部得分,当所有人脸检
测框执行非最大值抑制后,得到最终的人脸检测结果。
该 SSD 人脸检测模型的损失函数包含了人脸/背景分类的 softmax 损失 LconfLconf 和
人脸检测框回归的 smooth L1 损失 LlocLloc:
Lface(x,c,t,t∗)=1N(Lconf(x,c)+λLloc(x,ti,t∗i))Lface(x,c,t,t∗)=1N(Lconf(x,c)+λLloc(x,ti,ti∗))
(1)
式中:NN 为匹配到人脸检测框的数量;xx 为检测框属于人脸的得分,是则取 1,不
是则取 0;cc 为检测目标的人脸置信度;titi 为人脸预测框;t∗iti∗为人脸真实框;λλ 为平
衡 softmax 损失和 smooth L1 损失的权重。
在训练时,为了提高运行效率和检测效果,对正负训练样本比例进行控制。首先计算
先验框和真实框的交并比(IntersectionoverUnion,IoU)(IntersectionoverUnion,IoU),
取 IoU>0.5IoU>0.5 的先验框为正样本,其余先验框为负样本。接着,将检测框与负样本集
进行一一匹配,删除匹配失败的检测框以平衡正负样本数量,提高训练的收敛速度。
2. 基于增强卷积神经网络的尺度不变人脸检测方法
2.1 总体结构
文中提出的基于增强卷积神经网络的尺度不变人脸检测模型如图 2 所示,该模型主要
分为基础卷积层、特征增强网络、增强特征层和多任务损失层 4 个部分。
基础卷积层采用 SSD 模型从 Conv3_3~Conv7_2 的 6 个多尺度卷积层,每层对应生成
的特征图为 f_1(160×160)、f_2(80×80)、f_3(40×40)、f_4(20×20)、f_5(10×10)
和 f_6(5×5)。其中,前 2 个特征图 f_1 和 f_2 被送入特征增强网络进行特征增强。后 4
个特征图直接被用来进行人脸/背景分类和人脸边界框位置回归。
图 2 基于增强卷积神经网络的尺度不变人脸检测模型
Fig. 2 Scale-invariant face detection model based on enhanced convolutional neural network
下载: 全尺寸图片 幻灯片
特征增强网络负责协调组合当前层特征图和前后两层特征图的上下文信息。对这 3 层
特征图进行归一化卷积、上采样、下采样、点乘、连接和扩张卷积等操作后,得到当前层
特征图的增强特征图,并且它们的尺寸与当前层特征图保持一致。由于浅层特征图更适合
进行小尺寸目标检测,因此增强特征图 ef_1 和 ef_2 被用来进行小尺寸人脸检测。另外,在
训练时还为 ef_1 和 ef_2 加入了负样本筛选,通过增加分类的难度来降低由小尺寸锚框引起
的人脸检测假正率升高,进一步提高了人脸检测精度。
剩余11页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3642
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 以简单、易用、高性能为目标、开源的时序数据库,支持Linux及Windows, Time Series Database.zip
- python-leetcode面试题解之第198题打家劫舍-题解.zip
- python-leetcode面试题解之第191题位1的个数-题解.zip
- python-leetcode面试题解之第186题反转字符串中的单词II-题解.zip
- 一个基于python的web后端高性能开发框架,下载可用
- python-leetcode面试题解之第179题最大数-题解.zip
- python-leetcode面试题解之第170题两数之和III数据结构设计-题解.zip
- python-leetcode面试题解之第168题Excel表列名称-题解.zip
- python-leetcode面试题解之第167题两数之和II输入有序数组-题解.zip
- python-leetcode面试题解之第166题分数到小数-题解.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功