没有合适的资源?快使用搜索试试~ 我知道了~
根据第 3 节的条件分布讨论,, , ~ (()|(), ()|())因此那么根据多元高斯分布公式,得到(M 步):直接写要最大化的目标是其中待估参数是, ,下
资源详情
资源评论
资源推荐
因子分析(Factor Analysis)
JerryLead
csxulijie@gmail.com
2011 年 5 月 11 日
1 问题
之前我们考虑的训练数据中样例
的个数 m 都远远大于其特征个数 n,这样不管是进
行回归、聚类等都没有太大的问题。然而当训练样例个数 m 太小,甚至 m<<n 的时候,使
用梯度下降法进行回归时,如果初值不同,得到的参数结果会有很大偏差(因为方程数小于
参数个数)。另外,如果使用多元高斯分布(Multivariate Gaussian distribution)对数据进行拟合
时,也会有问题。让我们来演算一下,看看会有什么问题:
多元高斯分布的参数估计公式如下:
分别是求 mean 和协方差的公式,
表示样例,共有 m 个,每个样例 n 个特征,因此
是 n 维向量,是 n*n 协方差矩阵。
当 m<<n 时,我们会发现是奇异阵(
),也就是说
不存在,没办法拟合出多
元高斯分布了,确切的说是我们估计不出来。
如果我们仍然想用多元高斯分布来估计样本,那怎么办呢?
2 限制协方差矩阵
当没有足够的数据去估计时,那么只能对模型参数进行一定假设,之前我们想估计出
完全的(矩阵中的全部元素),现在我们假设就是对角阵(各特征间相互独立),那么我
们只需要计算每个特征的方差即可,最后的只有对角线上的元素不为 0
回想我们之前讨论过的二维多元高斯分布的几何特性,在平面上的投影是个椭圆,中心
点由决定,椭圆的形状由决定。如果变成对角阵,就意味着椭圆的两个轴都和坐标轴平
行了。
如果我们想对进一步限制的话,可以假设对角线上的元素都是等值的。
其中
也就是上一步对角线上元素的均值,反映到二维高斯分布图上就是椭圆变成圆。
当我们要估计出完整的时,我们需要 m>=n+1 才能保证在最大似然估计下得出的是非
奇异的。然而在上面的任何一种假设限定条件下,只要 m>=2 都可以估计出限定的。
这样做的缺点也是显然易见的,我们认为特征间独立,这个假设太强。接下来,我们给
出一种称为因子分析的方法,使用更多的参数来分析特征间的关系,并且不需要计算一个完
整的。
3 边缘和条件高斯分布
在讨论因子分析之前,先看看多元高斯分布中,条件和边缘高斯分布的求法。这个在后
面因子分析的 EM 推导中有用。
假设 x 是有两个随机向量组成(可以看作是将之前的
分成了两部分)
其中
,
,那么
。假设 x 服从多元高斯分布,其中
其中
,
,那么
,
,由于协方差矩阵是对称阵,因此
。
整体看来
和
联合分布符合多元高斯分布。
那么只知道联合分布的情况下,如何求得
的边缘分布呢?从上面的和可以看出,
,
,下面我们验证第二个结果
由此可见,多元高斯分布的边缘分布仍然是多元高斯分布。也就是说
。
上面 Cov(x)里面有趣的是
,这个与之前计算协方差的效果不同。之前的协方差矩阵
都是针对一个随机变量(多维向量)来说的,而
评价的是两个随机向量之间的关系。比
如
={身高,体重},
={性别,收入},那么
求的是身高与身高,身高与体重,体重与体
重的协方差。而
求的是身高与性别,身高与收入,体重与性别,体重与收入的协方差,
看起来与之前的大不一样,比较诡异的求法。
上面求的是边缘分布,让我们考虑一下条件分布的问题,也就是
的问题。根据多
元高斯分布的定义,
。
且
这是我们接下来计算时需要的公式,这两个公式直接给出,没有推导过程。如果想了解
具体的推导过程,可以参见 Chuong B. Do 写的《Gaussian processes》。
4 因子分析例子
下面通过一个简单例子,来引出因子分析背后的思想。
因子分析的实质是认为 m 个 n 维特征的训练样例
的产生过程如下:
1、 首先在一个 k 维的空间中按照多元高斯分布生成 m 个
(k 维向量),即
2、 然后存在一个变换矩阵
,将
映射到 n 维空间中,即
因为
的均值是 0,映射后仍然是 0。
剩余10页未读,继续阅读
周林深
- 粉丝: 54
- 资源: 290
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0