聚类分析
1
例1 对10位应聘者做智能检验。3项指标X,Y和Z
分别表示数学推理能力,空间想象能力和语言理解
能力。其得分如下,选择合适的统计方法对应聘者
进行分类。
应聘者
1 2 3 4 5 6 7 8 9 10
X 28 18 11 21 26 20 16 14 24 22
Y 29 23 22 23 29 23 22 23 29 27
Z 28 18 16 22 26 22 22 24 24 24
§1 什么是聚类分析
2
聚类分析 研究对样品或指标分类问题的一种多元统计
方法.
根据一批样品的许多观测指标,按照一定的数
学公式具体地计算一些样品或一些参数(指标)
的相似程度,把相似的样品或指标归为一类。
分类问题
判别分析问题
聚类分析问题
问题:所研究问题的分类以及所观察的个
体的分类均未知。
目的:通过数据分析,选定度量个体接近
程度的统计量,建立分类方法,对观测对
象给出合理的分类。
3
聚类分析内容
系统聚类分析
直观,易懂。
快速聚类(动态聚类)
快速,动态。
4
按照分类对象不同
Q型聚类(样品聚类):对从实际问题中观
测得到n个样品,要根据某种相似性的原则,
将这个n样品进行分类.
R型聚类(变量聚类):即对所考察的p个指
标的n个观测值,要根据某种相似性的原则将
这个p指标进行分类.
5