没有合适的资源?快使用搜索试试~ 我知道了~
基于MTCNN与改进Camshift相结合的人脸检测算法.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 123 浏览量
2022-12-15
14:16:21
上传
评论
收藏 1.41MB DOCX 举报
温馨提示
试读
15页
基于MTCNN与改进Camshift相结合的人脸检测算法.docx
资源推荐
资源详情
资源评论
目标的检测与跟踪在计算机视觉领域是一个非常活跃的研究方向
[1]
,同时也是动态人
脸识别、智能安防监控、智能交通等领域的核心问题。常见的目标跟踪算法主要有:1)基
于目标模型建模的算法,如区域匹配、特征点跟踪、光流法等;2)基于搜索的算法,如粒
子滤波
[2]
、kalman 滤波
[3]
、Camshift
[4]
等算法。目前在已有目标跟踪算法中,均值偏移
(Meanshift)算法凭借计算简单、实时性较好
[5]
等优点被广泛应用于人脸跟踪等领域。Bradski
等
[4]
在 Meanshift 算法的基础上提出了 Camshift 算法。从本质上说,这 2 种算法都是爬坡算
法,即在数据的概率密度分布中反复迭代,进而求解出局部极值稳定的算法
[5]
。
Camshift 算法是一种无参估计跟踪算法,该算法利用视频序列中被跟踪物体的颜色特
征信息来实现对运动目标的跟踪
[6]
。传统的 Camshift 算法在光照的变化及被跟踪目标与背
景环境颜色相似的情况下,跟踪效果不明显
[7]
。针对 Camshift 算法的这一不足,可将贝叶
斯概率框架
[8]
与传统的 Camshift 算法相结合,但计算的复杂度会增加,从而导致跟踪的实
时性变差。
对于视频序列,原始的多任务级联卷积神经网络(multi-task convolutional neural
network,简称 MTCNN)人脸检测算法仅在 CPU 的运行环境下不能满足视频流中的人脸实
时检测
[9]
。鉴于此,提出一种改进的 Camshift 算法。将 Camshift 算法与 MTCNN 人脸检测
算法相结合,通过 MTCNN 人脸检测算法实现 Camshift 算法跟踪框位置和大小的初始化,
从而实现自动跟踪检测人脸。利用 Bhattacharyya 系数
[10]
判定 Camshift 算法是否出现相近色
干扰问题,并采用相应方法进行处理。
图 1 MTCNN 人脸检测网络
下载: 全尺寸图片 幻灯片
1. MTCNN 人脸检测算法
1.1 算法原理
人脸检测是在图像或者视频序列中找到人脸并返回人脸框大小和位置坐标信息的过
程,本研究采用 MTCNN 算法对人脸及人脸关键点进行检测。MTCNN
[11]
算法是一种基于
卷积神经网络的多任务级联人脸检测算法,它主要由 P-Net、R-Net 和 O-Net 组成,可以检
测出人脸框和特征点。
1) P-Net(proposal network)提案网:通过全卷积网络获得人脸候选框和边界框回归向
量,并利用边界框回归向量对人脸候选框进行校准,用非极大值抑制(Non-maximum
suppression,简称 NMS)
[12]
算法合并重叠的人脸候选框。P-Net 主要用来生成一些人脸候选
框。
2) R-Net(Refine Network)精炼网:将 P-Net 得到的候选窗作进一步筛选,剔除人脸候
选框中的假阳性样本,同样通过边界框回归向量校准和 NMS 算法得到更加精确的人脸候
选区域。R-Net 主要用来去除大量的非人脸框。
3) O-Net(Output Network)输出网:其功能与 R-Net 类似,对 R-Net 的输出执行更精确
的操作,主要对人脸候选区域进行精确筛选,获得最终的人脸位置,同时得到双眼、鼻
子、嘴角两侧 5 个关键点坐标。O-Net 与 R-Net 类似,在 R-Net 的基础上增加了 landmark
位置的回归。
1.2 侧脸检测框修正
MTCNN 算法 landmark 示意图如图 2 所示。从图 2 可看出,人脸坐标参数为:人脸
框坐标(x
1
, y
1
)和(x
2
, y
2
),左眼坐标(x
e, 1
, y
e, 1
),右眼坐标(x
e, 2
, y
e, 2
),鼻子坐标(x
n, 1
, y
n, 1
),左嘴角
坐标(x
m, 1
, y
m, 1
),右嘴角坐标(x
m, 2
, y
m, 2
)。在 MTCNN 进行实际的人脸检测的过程中会出现人
脸偏转的现象,主要分为平面内偏转和平面外偏转。针对人脸检测过程中出现平面外旋转
的现象,对 MTCNN 人脸检测框进行修正。x
e, 1
-x
1
为左眼到人脸检测框左侧的水平距离,y
e,
1
-y
1
为左眼到人脸检测框上边界的垂直距离,x
2
-x
e, 2
为右眼到人脸检测框右侧的水平距离, y
e,
2
-y
2
为右眼到人脸检测框上边界的垂直距离,x
e, 2
-x
e, 1
为双眼间的距离;x
m, 1
-x
1
为左嘴角到人
脸检测框左侧的水平距离,x
2
-x
m, 2
为右嘴角到人脸检测框右侧的距离, y
2
-y
m, 1
为人脸框下边
界到左嘴角的垂直距离,y
2
-y
m, 2
为人脸框下边界到右嘴角的垂直距离。
图 2 MTCNN 算法 landmark 示意图
下载: 全尺寸图片 幻灯片
以下分为 3 种情况进行讨论:平面外向左旋转人脸、正面人脸和平面外向右旋转人
脸。当检测到平面外向左旋转的人脸和平面外向右旋转的人脸时,人脸框的宽度 W 的取值
范围为
。{Wmax=(xe,2−xe,1)+2max{(xe,1−x1),(x2−xe2)},Wmin=(xe,2−xe,1)+2min{(xe,1−x1),(x2−xe,2)},xe,1−x1≠x2−xe,2,Wmin<W<Wmax。
当检测到正面人脸时,人脸框的宽度 W 为
W=(xe,2−xe,1)+2(xe,1−x1),
。xe,1−x1=x2−xe,2。
当平面外向左旋转人脸、正面人脸和平面外向右旋转人脸时,人脸框的高度 H 取值范
围为
。{H=(y2−ym,1)+(y2−ym,2)2+(ye,1−y1)+(ye,2−y2)2,Hmax=H+max{(ym,1−ye,1),(ym,2−ye,2),Hmin=H+min{(ym,1−ye,1),(ym,2−ye,2)。
剩余14页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3663
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功