SPSS
在主成分分析中的应用
摘要 主成成分分析是一种对数据进行分析的技术,最重要的应用是对原有数
据进行简化。本文首先对主成成分分析方法的原理进行了简单的阐述。介绍了
进行主成成分分析的工具 SPSS,并以分析全国 31 个省市的 8 项经济目标为例,
给出了详尽的分析。实验结果表明,主成成分分析能有效的将原有的复杂数据
降维,同时包含原数据的大部分信息。
关键词 SPSS 主成分分析 经济发展指标
主成分分析是设法将原来众多具有一定相关性(比如 P 个指标),重新组合
成一组新的互相无关的综合指标来代替原来的指标。 通常数学上的处理就是将
原来 P 个指标作线性组合,作为新的综合指标。最经典的做法就是用 F1 (选取
的第一个线性组合,即第一个综合指标)的方差来表达,即
Var(F1)
越大,表示
F1 包含的信息越多。因此在所有的线性组合中选取的 F1 应该是方差最打的,
故称
F1
为第一主成分。如果第一主成分不足以代表原来
P
个指标的信息,再
考虑选取 F2 即选第二个线性组合,为了有效地反映原来信息,F1 已有的信息
就不需要再出现再
F2
中,用数学语言表达就是要求
Cov(F1, F2)=0
,则称 F2 为
第二主成分,依此类推可以构造出第三、第四,……,第 P 个主成分。
主成分模型:
pp221p1p
pp22221122
p1p2211111
aaa
aaa
aaa
XXXF
XXXF
XXXF
pp
满足以下条件:
),2,1(1
22
2
2
1
miaaa
piii
)()()(
21 p
FVarFVarFVar
二.利用
SPSS
进行主成成分分析实例
以全国 31 个省市的 8 项经济指标为例,进行主成分分析。
第一步:录入或调入数据(图
1
)。