提供系列函数用于聚类分析,归纳起来具体方法有如下:
方法一:直接聚类,利用 函数对样本数据进行一次聚类,其缺点为可供用户选择的面较
窄,不能更改距离的计算方法,该方法的使用者无需了解聚类的原理和过程,但是聚类效果受限制。
方法二:层次聚类,该方法较为灵活,需要进行细节了解聚类原理,具体需要进行如下过程处理:
()找到数据集合中变量两两之间的相似性和非相似性,用 函数计算变量之间的距离;()用
函数定义变量之间的连接;()用 函数评价聚类信息;()用 函数创建
聚类。
方法三:划分聚类,包括 均值聚类和 中心聚类,同样需要系列步骤完成该过程,要求使用者对聚
类原理和过程有较清晰的认识。
接下来,介绍 中的相关函数和相关聚类方法。
1.Matlab 中相关函数介绍
函数
调用格式: ! "
说明:用 ‘! 指定的方法计算 数据矩阵中对象之间的距离。’
:一个 !# 的矩阵,它是由 ! 个对象组成的数据集,每个对象的大小为 。
! 取值如下:
$ :欧氏距离(默认);‘ :标准化欧氏距离;
$! :马氏距离;‘% :布洛克距离;
$!& :明可夫斯基距离;‘ :
$ : ‘!! :
$' : ‘%( :)%( 距离。
*+! 函数
调用格式:,*+!"
说明: 强制将距离矩阵从上三角形式转化为方阵形式,或从方阵形式转化为上三角形式。
函数
调用格式:, ! "