人脸识别是近年来较为热门的研究方向,在公安、门禁系统和一些软件领域都有广泛
的应用,但是其仍面临以下问题:1)训练数据和应用场景数据的分布存在差异; 2)特殊领域
的数据较难收集,并且标注图片是一项人力财力消耗巨大的任务,导致与应用场景分布相
同的训练数据匮乏。
传统的机器学习方法如线性判别分析(LDA)、支持向量机(SVM)
[1]
能够较好地分类预测
问题,但前提是假设训练数据和测试数据是从相同的分布中取样。当测试和训练数据来自
不同域时,其性能将严重退化。为解决该问题,域自适应方法
[2-3]
将丰富的监督信息(源域)
迁移到另一个不同但相关的领域(目标域)。子空间学习是域自适应的一种方法,文献[4]在
保持数据的原始结构的同时,通过最小化源域和目标域之间的差异得到潜在的公共子空
间。但上述方法只利用了源域和目标域的共同特征,忽略了目标域对分类任务有利的特定
信息。文献[5]提出了一种 TSD 域自适应方法,带有标签的源域数据由公共子空间中的目
标域数据(称为目标化源域)表示。TSD 的公共子空间在较好地保持源域和目标域结构的基
础上使源域和目标域数据具有良好的交融性。文献[6-7]提出多源域自适应方法,TMSD
[8]
是
在 TSD 方法的基础上拓展为多源域的自适应方法,从多个源域迁移更为丰富的监督信息,
从而提高模型的性能。
以上子空间方法使用的是单个子空间,当代价函数最小时,目标域表示的源域的最优
结果是固定的,然而,单个子空间不能提供更为丰富的判别信息。为得到更多的判别信
息,提出了一个域自适应的泛化学习框架,同一个样本在不同的子空间中能够获得不同的
判别信息。首先,随机选择样本作为每个子系统的训练样本; 其次,为每个子系统学习一
个公共子空间,要求在公共子空间中源域和目标域特征能够很好地交融在一起,且域本身
的结构也能较好地保留,用目标域数据进行线性组合来表示源域样本; 然后,为每个子系
统中新的源域数据学习一个判别模型; 最后,通过多数投票与总和规则的策略将所有子系
统结合起来得到最终的分类结果。实验结果表明,框架能够显著提高人脸识别的性能。
1. 域自适应泛化学习框架
1.1 符号和定义
人脸识别问题有如下定义:X
g
=[x
1
g
, x
2
g
, …, x
ng
g
]为图片库,其标签为 L={ L
i
}
i=1
c
; x
p
为待
识别的样本数据,识别函数 Label(x
p
)∈ L。图片库与待识别样本与目标域数据分布一致,
x
p
通过与图片库中每个样本数据进行相似度比对,得到 x
p
的标签。
单源域中的源域样本为
Xs=[x1s,x2s,⋯,xnss]∈Rds×ns,xis∈Rds×1,
其类别标签为
Ys=[y1s,y2s,⋯,ynss],yis∈{1,2,⋯,cs},