(1)熟悉利用主成分分析进行数据分析,能够使用 SPSS 软件完成数据的主
成分分析;
(2)熟悉利用聚类分析进行数据分析,能够运用主成分分析的结果,做进一
步分析,如聚类分析、回归分析等,能够使用 SPSS 软件完成该任务。
【实验要求】
根据各个题目的具体要求,分别运用 SPSS 软件完成实验任务。
【实验内容】
1、表 4.9(数据见 exercise4_5.txt)给出了 1991 年我国 30 个省市、城镇
居民的月平均消费数据,所考察的八个指标如下:(单位均为元/人)
X1: 人均粮食支出; X2:人均副食支出;
X3: 人均烟酒茶支出; X4: 人均其他副食支出;
X5:人均衣着商品支出; X6: 人均日用品支出;
X7: 人均燃料支出; X8: 人均非商品支出。
(1)求样本相关系数矩阵 R。
(2)从 R 出发做主成分分析,求出各主成分的贡献率及前两个主成分的累积
贡献率;
2、(1)对题 1 中的数据,按照原有的八个指标,对 30 个省份进行聚类,给
出分为 3 类的聚类结果。
(2)利用题 1 得到的前 2 个主成分指标,分别按最短距离法(最近邻居距
离)、最长距离法(最远邻居距离)、类平均距离法(组间平均距离)、 重心距离
法;其中距离均采用欧式平方距离,对样本进行谱系聚类分析,并画出谱系聚类
图;给出分为 3 类的聚类结果。并与(1)的结果进行比较。
【实验步骤】
1-1-a 实验过程
1、 选择菜单->【分析】->【降维】-> 【因子】(图 1-1)
2、 将 V1——V9 拖入变量(图 1-2)
3、 点击概述,勾选系数 和 KMO 和巴特利特球形梯度检验(图 1-3)
4、 点击提取,勾选碎石图(图 1-4)
5、 点击旋转,勾选载荷图(图 1-5)
评论0