没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
人脸识别综述
学生姓名
1
1
(东南大学 计算机科学与工程学院,南京 211189)
A Survey on Face Recognition
*
Student Name
1+
1
(School of Computer Science Engineers, Southeast University, Nanjing 211189, China)
+ Corresponding author: Phn: +1850098xxxx, E-mail: 2311990815@qq . com
Abstract: S t a r t i n g i n t h e s i xt i e s , f a c e r e c o g n i t i o n h a s b e c o m e o n e o f t h e m o s t r e s e a r c h e d t o p i c s i n c o m p u t e r
v i s i o n a n d b i o m e t r i c s . T r a d i t i o n a l m e t h o d s b a s e d o n h a n d - c r a f t e d f e a t u r e s a n d t r a d i t i o n a l m a c h i n e l e a r n i n g
techniques have recently been superseded by deep neural networks trained with very large datasets. In this paper
we provide a comprehensive and upto-date literature review of popular face recognition methods including both
traditional (geometry-based, holistic, feature-based and hybrid methods) and deep learning methods.
Key words: face recognition; machine learning; neural networks; computer vision; biometrics;
Supported by …;
作者简介: 我…
摘 要: 从60年代开始到现在,人脸识别一直是计算机视觉和生物识别研究的主题。传统的基于手动设计
提取特征和传统机器学习的方法已经被使用大量数据训练出的深度神经网络所取代。本文给出一个从传统
(基于几何、整体、基于特征和混合方法)到深度学习热门的人脸识别方法的综合论述。
关键词: 人脸识别;机器学习;神经网络;计算机视觉;生物识别;
1 引言
人脸识别是指能够从图像、视频中识别或验证主体(人)身份的技术。第一个人脸识别算法开始于70
年代早期[1],[2]。从那以后,人脸识别的准确度一直在不断的提高,目前人脸识别的生物识别方法常常比
其他传统成熟的生物识别(比如指纹、虹膜识别[3])更受欢迎。这是因为人脸识别有着其独特的优点。其
中一个就是人脸识别不涉及到隐私侵犯的问题,比如,指纹识别需要识别对象把手指放到指纹识别传感器
上;虹膜识别需要识别对象的眼睛距离摄像机很近;而声音识别需要识别对象的声音足够响亮。而现在的人
脸识别系统仅要求识别主体在摄像机的视野范围内即可(假设主体与摄像机在一个合理的距离内)。这使得
人脸识别是一个最好的用户友好型生物识别方法。这意味着人脸识别拥有更广泛的应用前景,它可以被部署
在那些用户不太配合的地方,比如视频监控系统。另外,人脸识别在门禁系统、安检系统、身份识别、社交
媒体等方面也有着广泛的应用。
非限制条件下的人脸识别是最具挑战的生物识别方法之一,这种部署在现实生活中的人脸识别拥有很
高的可变性(这种人脸图像通常称为自然脸,faces in-the-wild)。这些变化通常包括头部姿势、年龄、遮
挡、光照和表情等。如图1所示。
图1:几种典型的自然脸。(a)头部姿势,(b)年龄,(c)光照,(d)表情,(e)遮挡。
多年以来人脸识别技术有了很大的发展。传统基于手工提取特征的边界、纹理描述器,与机器学习相
结合的主成分分析(PCA)、线性判别分析( LDA)和支持向量机(SVM)。在非限制条件下产生的变化
使得人工提取特征非常困难,以至于研究人员只能针对某种具体的变化设计专门的方法,比如年龄不变性方
法[4],[5];姿势不变性方法[6],光照不变性方法[7],[8]等。最近,传统的人脸识别方法已经被基于卷积神经
网络(CNNs)的深度学习方法所取代。深度学习的主要优点是它可以通过一个很大的数据集学习到一个最
好的特征 表示。这种包 含现实变 化的自然 脸可以通过网 络来进行大规 模的收集 [9][10][11][12][13][14]
[15]。使用这些数据训练出来的基于CNN的人脸识别方法已经获得了很高的精确度,这是应为它们可以通过
训练的现实人脸图片学习到稳定的特征。另外,随着CNNs被用于解决许多其他的计算机视觉难题,深度学
习方法在计算机视觉上的应用也同样加快了人脸识别技术的研究,比如物体的检测、识别和分割,光学字符
识别、表情分析和年龄估计等。
1
???
人脸识别系统通常由以下几块组成:
图2:人脸识别的组成部分。
1)人脸检测(face detection)。 使用人脸检测器在图像中检测出脸的位置,如果检测到就用边框标
记出来,返回边框的位置坐标。如图3a所示。
2)人脸对齐(face alignment)。 人脸对齐是使用一组参考点来定位图像中的固定的几个位置来完成
人脸图像的缩放和裁剪。在简单的2D人脸对齐中,通常需要使用人脸标志(landmark)检测器来找出一组人
脸的标志位置与参考点相配合以找出最好的仿射变换(affine transformation)。图 3b和3c表示使用一组相同
的参考点来实现人脸的对齐。更为复杂的3D人脸对齐算法(如[16])可以实现人脸的转正,即可以改变人脸
的位置使之面向正前方。
3)人脸表征(face representation)。 在人脸表征阶段,人脸图像的像素值被转换成一个紧凑可判别
的特征向量,也称作模板。事实上同一个主体的不同人脸图像应该映射成相似的特征向量。
4)人脸匹配(face matching)。 在人脸匹配环节,通过比较两个人脸模板来获得一个表示属于同一
主体的可能性的相似值。
人脸表征可以认为是人脸识别系统中最重要的部分,也是本文第二部分文献综述关注的重点。
图3:(a)用人脸检测器圈出人脸。(b)和(c)参考点和人脸对齐。
2 文献综述
早期的人脸识别关注的方法是使用图像处理技术来匹配简单描述的人脸几何特征。即使这些方法只能在
非常苛刻的条件下才能工作,但是他们显示出了使用计算机实现人脸自动识别的可能性。之后,像主成分分
析PCA和线性判别分析(LDA)等统计子空间方法变得越来越流行。这些方法因为使用整个面部区域作为输
入而称作整体(holistic)方法。同时,计算机视觉领域的进步导致局部特征提取器的发展,它可以描述一幅图
像中不同区域的纹理。这种通过匹配人脸图像的局部特征来实现的人脸识别称作基于特征的人脸识别方法
(feature-based method)。整体方法和基于特征的方法得到进一步的发展,然后又结合起来形成混合的方
法。直到深度学习出现并成为计算机视觉应用包括人脸识别的主要方法以前,基于混合方法的人脸识别系统
依然代表着人脸识别的最高水平。本文后面的部分给出了前面几种方法中一些最具代表性研究工作的概述。
2.1 基于几何的方法(Geometry-based Methods)
70年代早期Kelly[1]和Kanade[2]博士论文被认为是最早关于自动人脸识别的研究工作。他们提出使用专
门的边界和轮廓探测器来找出一系列的人脸标志,再测量它们之间的相对位置和距离。早期的系统的精确度
仅在很小的数据库上演示([1]中使用了10个主体的数据库而[2]中使用了20个人的数据库)。在[17]中,一
种类似[2]的基于几何的方法与另一种把人脸图像描述为梯度图像的方法做了比较。作者表示梯度图像的方
卢宁宁 :人脸识别综述
2
法比基于几何的方法识别准确度好,但是基于几何的方法速度更快内存使用更少。使用人脸标志和它们之间
的几何关系进行人脸识别在[18]中作了详尽的研究。具体来说,他们提出了一种基于测量两组人脸标志之间
的普鲁克距离(Procrustes distance)方法和另一中基于测量人脸标志之间距离比例的方法。作者认为虽然其他
能够提取更多信息的方法(如整体方法)可以达到更高的精确度,该基于几何的方法速度更快而且可以和其
他方法结合成混合方法。由于在3D标志中编码了深度信息[20][21],基于几何的3D人脸效率更高,这已经得
到了证明。
基于几何的人脸识别在早期的人脸识别研究中是至关重要的。它可以作为一个该综述后面所描述的先
进方法的更快替代选择或与它们结合起来。
图4:从ORL人脸数据库中计算出的本征脸,按差异从大到小排序的前5个。
2.2 整体方法(Holistic Methods)
整体识别方法是用整个人脸区域的信息来描述人脸特征,通常是把人脸图像投射到一个低维空间来过滤
掉不相关的细节和其他影响识别的变量。这种类别中,其中一个比较流行的方法是使用主成分分析
(Principal Component Analysis,PCA)。在 [22][23]首先提出这种想法,把PCA应用在一组训练的人
脸图像,以获得可以表示数据分布差异的本征向量,由于该本征向量与人脸的相似性通常也叫做本征
脸。如图4所示。该方法通过把被识别对象的人脸图像投射到由本征脸构成的子空间中来获取本征脸线
性组合的权重。在[24]中使用了这种想法,通过比对识别对象的权重和数据存储的权重来输出人脸识别
的结果。在[25]中提出了基于概率的版本,即使用贝叶斯算法来分析图像差异。这种方法使用两个本征
脸集合分别构造了对象内部(intra-person)和对象之间(inter-person)的变量模型。在原始的本征脸方
法的基础上还提出了很多变体版本。例如[27]提出的基于核方法的非线性扩展的PCA,即核PCA[26];
独立成分分析(ICA)[28],在[29]中提出的一种可以捕捉像素间的高阶相关性的PCA泛化;在[30]中提
出的基于2D图像矩阵的2维PCA,而不是1D向量。
基于PCA的方法存在一个问题,就是投影时会最大化训练集中所有图像的差异。这表明顶端的本征向量
可能会对识别准确度产生负面影响,因为它们可能是与识别任务无关的对象内的(intra-person)变量(比如
光照、姿势和表情)。在[32]中提出了基于线性判别分析(LDA)的整体方法,也称作Fisher判别分析,用来
解决[33][34][35][36]中的问题。LDA的主要思想是使用类标签找到一个投影矩阵W来最大化类间差异同时最
小化类内差异:
这里的S
w
和S
b
类内(within-class)和类间(between-class)散度矩阵,定义如下:
这里的x
j
表示数据样本,µ
k
是类C
k
的均值,µ是全局均值,K是数据库中的类号,通过计算分离矩阵S =
S
w
−1
S
b
的本征向量可以求出公式(1)的解。与PCA类似,LDA也可以通过选择最大本征值对应的本征向量
的子集来实现降维处理。虽然在人脸识别中LDA与PCA相比更具有优势,但是单纯基于LDA方法的人脸识
别很可能因为类内的散度矩阵估计不准而产生过拟合现象[35][36],特别是在使用高维度小样本集来训练的
3
???
剩余18页未读,继续阅读
资源评论
Austinla
- 粉丝: 0
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功