主成分分析
类型:一种处理高维数据的方法。
降维思想:在实际问题的研究中,往往会涉及众多有关的变量。但是,变
量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题
带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有
所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所
提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,
用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通
过对新变量的分析达到解决问题的目的。
一、总体主成分
1.1 定义
设 X
1
,X
2
,…,X
p
为某实际问题所涉及的 p 个随机变量。记
X=(X
1
,X
2
,…,Xp)
T
,其协方差矩阵为
它是一个 p 阶非负定矩阵。设
(1)
则有
(2)
第 i 个主成分:
一般地,在约束条件
评论0
最新资源