
FCM 算法是一种基于划分的聚类算法,它的思想就是使得被划分到同
一簇的对象之间相似度最大,而不同簇之间的相似度最小。模糊 C 均
值算法是普通 C 均值算法的改进,普通 C 均值算法对于数据的划分是
硬性的,而 FCM 则是一种柔性的模糊划分。在介绍 FCM 具体算法之
前我们先介绍一些模糊集合的基本知识。
1 模糊集基本知识
首先说明隶属度函数的概念。隶属度函数是表示一个对象 x 隶属于
集合 A 的程度的函数,通常记做μA(x),其自变量范围是所有可能属
于集合 A 的对象(即集合 A 所 在 空 间 中 的 所 有 点 ) , 取 值 范 围 是
[0,1],即 0<=μA(x)<=1。μA(x)=1 表示 x 完全隶属于集合 A,相当
于传统集合概念上的 x∈A。一个定义在空间 X={x}上的隶属度函数就
定义了一个模糊集合 A,或者叫定义在论域 X={x}上的模糊子集。对
于有限个对象 x1,x2,……,xn 模糊集合可以表示为:
(6.1)
有了模糊集合的概念,一个元素隶属于模糊集合就不是硬性的了,
在聚类的问题中,可以把聚类生成的簇看成模糊集合,因此,每个样
本点隶属于簇的隶属度就是[0,1]区间里面的值。
2 K 均值聚类算法(HCM,K-Means)介绍
K 均值聚类(K-Means),即众所周知的 C 均值聚类,已经应用到
各种领域。它的核心思想如下:算法把 n 个向量 xj(1,2…,n)分为 c 个
组 Gi(i=1,2,…,c),并求每组的聚类中心,使得非相似性(或距离)指