5星 · 超过95%的资源 1 下载量 136 浏览量
2022-11-13
21:18:39
上传
评论
收藏 478KB PPT 举报 第
第
4
4
章
章
聚
聚
类
类
分
分
析
析
( cluster analysis)
( cluster analysis)
§4.1 样品(变量)相近性度量
§4.2 谱系聚类法及MATLAB实现
§4.3 快速聚类法
.
统计方法(聚类分析):
聚类分析—所研究的样本或者变量之间存
在程度不同的相似性,要求设法找出一些
能够度量它们之间相似程度的统计量作为
分类的依据,再利用这些量将样本或者变
量进行分类
系统聚类分析—将
n
个样本或者
n
个指标看
成
n
类,一类包括一个样本或者指标,然
后将性质最接近的两类合并成为一个新类
,依此类推。最终可以按照需要来决定分
多少类,每类有多少样本(指标)
.
统计方法(系统聚类分析步骤):
系统聚类方法步骤:
1. 计算
n
个样本两两之间的距离
2. 构成
n
个类,每类只包含一个样品
3. 合并距离最近的两类为一个新类
4. 计算新类与当前各类的距离(新类与
当前类的距离等于当前类与组合类中包
含的类的距离最小值),若类的个数等
于1,转5,否则转3
5. 画聚类图
6. 决定类的个数和类。
.
系统聚类分析:
主要介绍系统聚类分析方法。系统聚类法
是聚类分析中应用最为广泛的一种方法
,它的基本原理是:首先将一定数量的
样品或指标各自看成一类,然后根据样
品(或指标)的亲疏程度,将亲疏程度
最高的两类进行合并。然后考虑合并后
的类与其他类之间的亲疏程度,再进行
合并。重复这一过程,直至将所有的样
品(或指标)合并为一类。
.
系统聚类分析用到的函数:
函 数 功 能
pdist
计算观测量两两之间的距离
squareform
将距离矩阵从上三角形式转换为方形
形式,或从方形形式转换为上三角形
式
linkage
创建系统聚类树
dendrogram
输出冰柱图
cophenet
计算Cophenetic相关系数
cluster
根据linkage函数的输出创建分类
clusterdata
根据数据创建分类
inconsistent
计算聚类树的不连续系数
.
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈