下载  >  开发技术  >  其它  > 论文研究-基于深度学习的人脸识别算法研究 .pdf

论文研究-基于深度学习的人脸识别算法研究 .pdf 评分

基于深度学习的人脸识别算法研究,赵学斌,张雷,传统的人脸识别算法主要是基于图像的浅层特征提取,比如LBP、SIFT、HOG等图像特征描述算子,然后进行多种浅层特征融合,PCA降维之后��
山国武技论文在线 模型的隐减层特征的维度,以学习到更高效的特征,另·方面对网络的早期卷积层添加验证 监督信号。这篇论文也是第一次从特征的稀疏性 选择性 、强壮性 的角度去分析 模型所学习到的人脸特征。 发现二值化后的特 征仍然可以达到很好的识别性能,这在大型数据库中进行人脸检索具有很大的意义 还对特征输岀层的神经元进行了可视化分析,发现部分神经元的激活值集合能够 对人臉进行属性判别,比如,性别、人种、头发颜色、年龄、胡子等人脸属性。这对基于人 脸的多任务学 具有很大的启发意义。 还分析了当人脸图 像被部分遮盖的情况下,模型仍能取得较好的识别率。 在取得了 准确率,再次刷新纪录。 年,更深层的神经网络在众多物体识別领域取得∫突破性, 尤其 提出的 和牛津大学的实验室的深度模型在 比赛 上取得了最优秀的成绩。于是,汤晓鸡团队又发表了·篇论文简称 尝试把 和网络运用到人脸识别领域,目标是使用更深的网络模型学习到更丰富的人 脸髙层特征。由于人脸数据集的有限,更深层 网络与 在上取得了 同样的性能,随着数据集的增大, 的性能应该会超过 的,但是当时汤晓 鸥闭队并没有在人数据上进行性能评估。 年 公司在 上发表 论文, 在取得了 的性能,再次刷新纪录。 并没有使用基于 的方式去进行分类学习,然后提 取隐藏层作为人脸特征向量,而是直接进行端到端的学习,将原始图像映射到一个欧式距离 可测空间,从而使得在欧式空间里的距离的度量值直接表示着人脸的相似度。最后得到的人 脸特征向量仅仅为维,可以直接用于人脸身份识别、人脸验证以及人脸聚类等等。 引入了三元组损失 函数,在训练的时候,提出了高效的 元组的 选择算法,能够解决模型训练时的慢收敛问题。 和 公司运用海量的人脸数据集实现深层神经网络的训练,实现了很髙 的性能,但是两家公司的数据集并不公开,这使普通研究者对人脸识别算法的研究受到了很 大的阻碍。年,英国牛津人学 实验室 团队表发了 论文 并且公开了包含多达人、一共百万张的人脸数据集 在 和 的基础上,提出了更为简单、更为高效的深层神经网终,在比 和 数据集少很多的自己公开的数据集上,在同样实现很好的高达的识别性能 年,国内的百度提出了一种两步学习方法,结合类似 系列的 学习和深度度量学习,在百万的人脸数据集百万个个体上训练,该方法在上 取得了当时最好的 的识别性能。 公司在年也发表了篇论文 从网络上搜集了百万张人脸数据集用于深度模型训练,在上也取得了的识别 性能 年,中国科学院深圳先进技术研究院和否港屮文大学联合在 上发表一篇论 文,提出了新型的神经网络训练时的监督信号人臉中心性损失 文章里认为 同一个人的不同姿态、表情、光照、年龄等条件下的图像,虽然人眼视觉上公存在差异,但 是在高维的、抽象的、本质的特征空间内应该保持一致性。于是提出在基于 分类进 行训练的网络中在需要再添加一个人脸中心性损失监督信号即可实现人脸特征的类间最大 化、类内最小化。因为中心性损失不需要设计策略选择高效的三元组,所以相对」三元组更 谷易实现深层神经网络的训练收敛。 综上所述,近三年来基于深度学习的人脸识别技术发展主要体现在卷积神经网络模型的 山国武技论文在线 发展和神经网络训练的监督信号的发展。同样,本文的人脸识别算法设计的核心部分是深度 网络模垩的选择和损失函数的设计。 人脸识别算法设计 人脸识别算法框架主要包括人脸对齐模块、人脸特征提取模块、人脸特征运用模块,如 图所示。人脸对齐是人脸预处理模块,用于从图像检测出人脸和定位人脸特征关键点, 然后裁剪出指定尺寸大小的人脸部分。人脸特征提取模块,主要包括冽终模型结构改计和模 型训练的损失函数改计。人脸特征运用模块属于业务逻辑层,结合人捡特征的实际运用场景 可以设计出不同的算法,常用的有人脸验证、人脸身份识别、人脸聚类等,本课题研究人脸 验证运用场景,设计出不同的算法。 人脸对齐模块的算法设计 本论文采用 在 发表的 人脸对齐算法 认为 人脸检测和人脸对齐两项仼务具有内在关联性,所以使用人脸检测和人脸对齐多任务学习机 制,同时采用了级联组织的三个卷积神经网络,在 和 公开测试集上取 得了最好的成绩。 人脸检测分为三个阶段,如图所示,第一阶段,在构建图像金字塔的基础上, 利用全连接卷积网终称为来进行人脸检测,获取到很多的候选窗口和对应的人脸方 框线性回归≈标。然后使用非极大值抑制算法进行人臉候选框重叠整体操作。第二阶 段,使用了另一个卷积网络称为 ,进行人脸方框回归和进行修正,去除大量 不符合条件的候选框。第三阶段,与第二阶段类似,但是多输出了个人脸关键点。 Test image Image pyramid Bounding box regression R-Net NMS Bounding box regression O-N 图 人脸对齐流程 人脸特征提取模块的算法设计 人脸特征提取模块设计是人脸识别算法设计的核心环节,人脸特征提取算法的性能直接 山国武技论文在线 影响到整个人脸识别技术的性能。基于深度学习的人脸识别算法的核心就是设计优秀的深度 网络模型和合理的模型训练损失函数去提取髙层本质的人脸特征ε网络模型的训练是损失凶 数目标函数驱动的,损失函数的类型设计直接决定着神经网络的训练方向,从而决定着人 脸特征的提取程度。一个高性能的人脸特征应该至少具有两个特性:特征类间差异性最大和 特征类内差异性最大,所以损失函数的设计必须充分考虑到上述两个人脸特征向量特性 深度网络模型的设计 木论文选择了年月 公司 等人提出的 模 型 年月 等人提出的 作为人脸特征提取的神 经网络。 在 比赛上取得过第一名的优异成绩,并且目前已经 被广泛使用到各和领域,比如行人车辆检测、服装分类、文字识别等等。 是 瘦身网终,通过优化网终模块单元内部的结构,可以大大减少网终模型的参数,而不降低网 终的性能,模型甚至可以运行在于机、车载终端上。 模型损失函数的设计 神经网络的训练本质就是使网络中参数主要包括神经元之间的权重和偏差值学习到 使得既定的损尖函数得到最大值或者最小值。一个高效的人脸特征应该具有类间差异最大化 和类内差异最小化。我们可以通过网络训练时损失函数的选择来控制所提取的特征的类间差 异性和类内差异性。 特征类间或者类内差异一般指在特征空间内的可度量距离的差异性,可以是 范 式距离、余弦距离或者二值化后的海明距离等等,所以类间或类内差异性的可以直接表小为 类闩或类内距离差异性。范式距离更容易适用人脸验证、人脸分类、人脸聚类、人脸检 索等应用场景,而海明距离只用当提取的人脸特征在二值化操作仍然有效的场景里才会选择 使用。所以,一般情况下,我们近择基于范式距离的人脸特征监督信号作为网络训练时 的损失函数 类间差异最大化可以保证人脸特征具有很强的人脸区分性,实现不同个体的人脸分类; 类内差异最小化可以保证同一个体在各种环境噪声场景下仍然具有很相似的特征描述。此 外,高效的人脸特征还应该具备紧凑性和稀疏性等特点,便于特征的兀配检索以及应用场景 的迁移性。根据文献分析,通过设置有效的监督信号监督模型参数的训练,即选择合理 的损失函数,深度网络模型可以提取这样的特征 基于 多分类的损失函数的神经网络提取的特征只有人脸区分性,可以使不同 个体人脸图像特征间存在差异性,可以区分不同个体人脸图像。基于分类的损失函数可以很 谷易的实现人脸特征的类间差异最大化。人脸验证用于判断两张人脸图像是否属于同·个 人,我们可以在基于多分类的神经网络中添加人脸验证监督信号以控制网络参数的学习。尤 其将同一个体的不同人脸图像之问加上验证监督信号可以很有效减小特征的类内距离。 基于 的损失函数的神经网络无需借助分类器去提取 层向量作为 人臉描述特征,可以直接实现端到端的网络训练。 通过设置特征的类间距离与 类内距离的间隔,一步实现特征的类间距离最大化和类内距离最小化特性。但是,高效的人 脸图像三元组选取算法是个关键环节,海量的低效的三元组会导致网络很难收敛,甚至导致 网络无法训练 山国武技论文在线 中心性损伤 同样可以用于解决特征的类内差异性最小化问题。般作为 网络训练的辅助监督信号,可以是在基于分类损失的神经网络训练时,每一个 计算分类损失的同时,计算每个体的人脸特征中心性损失,可以用范式距离进行计算。 同样可以用在端到端的基于 的神经网络训练中。 我们可以通过损失函数的设计控制所提取的人脸特征的类间和类内距离的属性。不同 的损失函数控制着人特征向量的不同属性,如表所示,通常我们采用多种损失函数的 组合来共同控制网终的训练,从而从人脸图像中提取到理想的人脸特征向量。 表损失函数与对应的特征特性 损失函数属性 类间距离 类内距离 三元组损失 正验证损失 负验证损失 中心性损失 多分类损失 如下简要阐述下 损失、验证损失、三元组损失、中心性损失的大致过程 损失 假设在神经网络训练时,训练集由m个已标记的样本构成 )},其中输入特征x()∈91,特征向量x的维度为 n+1,x0=1对应截距项,y()∈{1,2,…k 损失函数/(e)表示为: x(i) 八()=-2z1E=11{y=小og-2 ∑ 其中,1{值为真的表达式}=1 )验证损失 f=Conv(x,U)表示为神经网络特征提取过程,其中x为输入的人脸图像,O为神经网 终训练学习的参数,f网终的人脸特征层的输出即人脸特征向量,Conv()表示人脸特征 提取函数。 人脸图像间的验证信号Verf()为 1 Verf(u,fj, yi, Bve) If fil, if yi;=1 max If fill )2 if yii 其中,y=1表小来自同一个体,y=-1表小千来自不问个体。e={m}需 要学习的参数,在网络训练时自适应设置,使得在当前的训练样本上具有最低验证误差。当 不同个体图像的特征向量距离小于阈值m,Verf(将产生损失值,当不同个体图像的特征向 量距离大于阈值m,venf()在当前迭代中将不再产生损失值,以防特例影响全局的情景发生 同一个体图像的特征向量距离一律作为损失值 山国武技论文在线 )三元组损失 将训练数据集中所有可能的人脸三元组集合记为。一个人脸三元组包含一个选定人脸 xa、同一个体的人脸x以及不同个体的人脸xn,表示为(xa,xD,x") 的训练目标的公式如下: 十c< )∈了 当f(x),f(x2),f(x2)不满足上述公式时,将产生损失值。我们记函数L(x)为 L( x) x if x>0 o else 则损失函数/(9)为: (0)=XNL(r(x9)(x)7(x)f(x)+a) 其中α值预先设置,推荐α∈(0.2,0.5)。 )中心性损失 基于多分类的神经网络训练的同时,选代学习一个个体y中心特征向量cy,并目计算 同一个体的人脸特征与Cy的距离。 基于 多分类和 的神经网络的损失函数(0)为: (6,W)=J(6,W)+2(6) log *b孓刁 xi-cy 其中,O为卷积层参数,W为 层参数 整体设计方案 人脸识别算法框架主要包含人脸对齐、特征提取网络模型和网络训练的损失函数三个模 块,如图所示。 分验三‖中 脸 特征提器征 类证 心 对 Conn 信∥信∥组/性 监‖损 齐 号‖号 督‖失 图人脸识别算法框榘图 本文的人脸识别技术统一使用 算法,所有数据集中人臉统一识别并对齐成 160×160尺寸大小。本论文没有采用多尺寸的图像训练不同的网络,然后融合多个神经网终 的特征值。融合的方式·般就是直接将多组特征向量拼接起来,使用降维,形成个 最终的人脸特征,进行人脸验证。 本论文使用不同的网络模型和不同的损失函数组合设计了个人脸识别算法,主要分为 两种类型 和 网络分别使用了 和 网终 两种损失函数的算法流程框架如图和图所示,两者的区别是网络训练时网络输入 数据的组成不同和驱动网络学习的损失函数设计不同。 山国武技论文在线 人睑 batch 元 Ancher 组 Positive 人脸 batch .和, 深度神经网络模型深度神经网络模型 Faced FaceID L2归一化 L2归一化 I FecelD+ FecelD+ 三元组损失 Softmax多分类器 图三元组损失的算法流程图 损失的算法流稈 由于特征向量的归一化操作不涉及参数学习,所以本章节的伪代码部分不特别写出 将特征向量归一化操作笼统地并入卷积网络模块。 损失和中心性损失混合损失函数 的神经网终训练过程如伪代码算法所示。 算法 损失和中心性混合损失函数的神经网络训练过程 输入:训练集x={(x2,l)}初始化网络模型参数θ。分类器参数a,超参数凡、a,参 数学习率n(t)t←0 大小为,人脸中心性特性向量cc[1,n 输出:6 初始化,~N(0,1),2e~N(01)c;~N(0,1) 网络没有收敛 t←-t+1从x中选取一个 Ⅹ=[(x;,l以lic[1,m}进行批量梯度下降 人脸特征向量f=COnD(x,C) 中心性损失函数 Cenloss=2m-1cyl2 △ 更新人脸中心性特性向量c=c1-a·Δc 网络损失函数Loss(,01a,x)=∑m1 Ident(f,l,a)+λ :分类器参数梯度Vd Loss(ec, 0id, X) ∑ dIdent fi,li,eid) λ OCenloss de d gid 山国武技论文在线 人脸特征向量梯度Vf=203。9ux :网络参数梯度V6c=1V aconv(xici o日 更新a=btg-n(t)·Va,θ=6-n(t).V 元组损失函数的关键点在于 的构建。网络训练时梯度下降的动力来自于违 反三元组不等式的三元组记作负性三元组。所以在构建三元组训练数据集时,应该尽可 能地生成更多的负性三元组,否则,网终的收敛速度将会非常的缓慢,甚至无法训练。本论 文改计的三元组选取流程见算法 算法三元组生成流程 输入:训练集x=(x;,L1)(x>=40个体集合l4|(x2;l)∈x 输出:三元组集合了 初始化:p=0,k=0 将随机分成大小为的集合{2∈[1m]m=32a0 p<m 对应每个∈p随机选取个图像(x2,l)∈[140]一共生成张图像 使用当前的神经网络,前向传播生成个 ,集合记作x1 k<1600 Fk∈x1选取 Fk argma, IF-FR Fk argminF, IF:Fl可以得到个F和个z :生成个三元组y加入 k=k+1 p=p+1 输出:一个生成了m×1600×39三元组; 注释:如果上述过程循环次,即可生成h×m×1600×39个三元组。 基于三元组损失的神经网络训练过程如算法所示,其中三元组的生成过程使用算法。 算法三元组损失函数的神经网络训练过程 输入:训练集x=x2,l2初始化网络模型参数Oa,参数学习率n(t)t←0 大小为,特征距离阈值α 输出 :初始化,θ~N(0,1),b=0 网络没有收敛 山国武技论文在线 t←t+1生成三元组集合了(xa,x2,x2)进行批量梯度下降 进行批量梯度下降法 b=b+1 从丁中选取 J={(x2,x,x)∈[1m] 人脸特征向量f2=Conv(xa,6) fi=Conv(x,,0)fn=Conv(xi, 0c) 归一化f1a If,P'll f f 冈络训练初期 Loss(6,了) C Loss(ec,")=2 max(0,0-lfafP+fia.f inll2) 人脸特征向量梯度Vf OLOSS(BC 网络参数梯度Vθ=∑V·(+3+a 更新=6-m(t)·V6 算法实现与性能分析 本章节内容包括人臉数据集概述和算法仿真与性能分析的实验部分。 人脸数据集 海量的人脸数据集是深度模型训练的必要条件之一。随着互联网技术的发展,很多公司 和研究机构发布了从互联网上搜集来的海量的人脸数据集。有些数据集只包含人脸身份信 息,有些还包含了人脸的属性信息,比如肤色、性别、发型、人脸特征点 等等 但是对于单任务的人脸识别项目而言,只需要人脸身份信息。 表人险数据集 数据集 人数 图片数量万 注释属性 人脸区域和身份 属性 身份标签 个特征点, 个人脸属性 身份标签 身份标签

...展开详情
所需积分/C币:10 上传时间:2019-08-16 资源大小:1.56MB
举报 举报 收藏 收藏 (2)
分享 分享
基于深度学习的人脸识别系统

立即下载
基于深度学习的人脸识别方法的研究

立即下载
ModbusTCP/RTU网关设计

立即下载
html+css+js制作的一个动态的新年贺卡

立即下载
iCopy解码软件v1.0.1.7.exe

立即下载