1 PCA 理论及其在人脸识别中的应用
龚 勋
1.1 问题描述
[1]
对于一幅图像可以看作一个由像素值组成的矩阵,也可以扩展开,看成一个矢量,如一
幅 N*N 象素的图像可以视为长度为 N
2
的矢量,这样就认为这幅图像是位于 N
2
维空间中的
一个点,这种图像的矢量表示就是原始的图像空间,但是这个空间仅是可以表示或者检测图
像的许多个空间中的一个。不管子空间的具体形式如何,这种方法用于图像识别的基本思想
都是一样的,首先选择一个合适的子空间,图像将被投影到这个子空间上,然后利用对图像
的这种投影间的某种度量来确定图像间的相似度,最常见的就是各种距离度量。
1.1.1 K-L 变换
[1]
PCA 方法是由 Turk 和 Pentlad 提出来的,它的基础就是 Karhunen-Loeve 变换(简称 KL
变换),是一种常用的正交变换。下面我们首先对 K-L 变换作一个简单介绍:
假设 X 为 n 维的随机变量,X 可以用 n 个基向量的加权和来表示:
1
n
ii
i
X
α
φ
=
=
∑
式中:
i
α
是加权系数,
i
φ
是基向量,此式还可以用矩阵的形式表示:
12 1 2
(, , , )( , , , )
T
nn
X
φφ φ αα α
==Φα
取基向量为正交向量,即
T
j
ΦΦ =
1
0
ij
ij
=
⎧
⎨
≠
⎩
T
j
I
⇒Φ Φ =
则系数向量为:
T
X
=Φα
综上所述,K-L 展开式的系数可用下列步骤求出:
步骤一
求随即向量
X
的自相关矩阵
T
REXX
⎡
⎤
=
⎣
⎦
,由于没有类别信息的样本集的
µ
均值向
量,常常没有意义,所以也可以把数据的协方差矩阵
()()
T
Ex x
µµ
⎡
⎤
=−−
⎣
⎦
∑
作为
K_L
坐标系的产生矩阵,这里
µ
是总体均值向量。
步骤二
求出自相关矩阵或协方差矩阵
R
的本征值
i
λ
和本征向量
i
φ
,
1
(,, , )
in
φφ φ
Φ
=
步骤三
展开式系数即为
T
X
=Φα
K_L变换的实质是建立了一个新的坐标系,将一个物体主轴沿特征矢量对齐的旋转
变换,这个变换解除了原有数据向量的各个分量之间相关性,从而有可能去掉那些带
有较少信息的坐标系以达到降低特征空间维数的目的。