模糊聚类分析算法大致可分为三类
1)分类数不定,根据不同要求对事物进行动态聚类,此类方法是基于模糊等价
矩阵聚类的,称为模糊等价矩阵动态聚类分析法。
2)分类数给定,寻找出对事物的最佳分析方案,此类方法是基于目标函数聚类
的,称为模糊 C 均值聚类。
3)在摄动有意义的情况下,根据模糊相似矩阵聚类,此类方法称为基于摄动的
模糊聚类分析法
聚类分析是多元统计分析的一种,也是无监督模式识别的一个重要分支,在模
式分类 图像处理和模糊规则处理等众多领域中获得最广泛的应用。它把一个没
有类别标记的样本按照某种准则划分为若干子集,使相似的样本尽可能归于一
类,而把不相似的样本划分到不同的类中。硬聚类把每个待识别的对象严格的划
分某类中,具有非此即彼的性质,而模糊聚类建立了样本对类别的不确定描述,
更能客观的反应客观世界,从而成为聚类分析的主流。
模糊聚类算法是一种基于函数最优方法的聚类算法,使用微积分计算技术求
最优代价函数,在基于概率算法的聚类方法中将使用概率密度函数,为此要假定
合适的模型,模糊聚类算法的向量可以同时属于多个聚类,从而摆脱上述问题。
我所学习的是模糊 C 均值聚类算法,要学习模糊 C 均值聚类算法要先了解虑
属度的含义,隶属度函数是表示一个对象 x 隶属于集合 A 的程度的函数,通常记
做μ (x),其自变量范围是所有可能属于集合 A 的对象(即集合 A 所在空间中的
A
所有点),取值范围是[0,1],即 0<=μ (x)<=1。μ (x)=1 表示 x 完全隶属于集合
A
A,相当于传统集合概念上的 x∈A。一个定义在空间 X={x}上的隶属度函数就定
义了一个模糊集合 A,或者叫定义在论域 X={x}上的模糊子集A。对于有限个对
象 x ,x ,……,x 模糊集合A可以表示为:
n
A {( (x ),x ) | x X}
有了模糊集合的概念,一个元素隶属于模糊集合就不是硬性的了,在聚类的
问题中,可以把聚类生成的簇看成模糊集合,因此,每个样本点隶属于簇的隶属
度就是[0,1]区间里面的值。
FCM 算法需要两个参数一个是聚类数目 C,另一个是参数 m。一般来讲 C 要
远远小于聚类样本的总个数,同时要保证 C>1。对于 m,它是一个控制算法的柔
性的参数,如果 m 过大,则聚类效果会很次,而如果 m 过小则算法会接近 HCM
聚类算法。
算法的输出是 C 个聚类中心点向量和 C*N 的一个模糊划分矩阵,这个矩阵表
示的是每个样本点属于每个类的隶属度。根据这个划分矩阵按照模糊集合中的最
大隶属原则就能够确定每个样本点归为哪个类。聚类中心表示的是每个类的平均