模糊C均值聚类算法的C++实现代码.pdf资源-CSDN文库

版权申诉

聚类

47 浏览量 2022-11-04 10:03:10 上传评论收藏 701KB PDF 举报

资源推荐

资源详情

资源评论

模糊 C 均值聚类算法的实现

研究背景

模糊聚类分析算法大致可分为三类

1）分类数不定，根据不同要求对事物进行动态聚类，此类方法是基于模糊等价

矩阵聚类的，称为模糊等价矩阵动态聚类分析法。

2）分类数给定，寻找出对事物的最佳分析方案，此类方法是基于目标函数聚类

的，称为模糊 C 均值聚类。

3）在摄动有意义的情况下，根据模糊相似矩阵聚类，此类方法称为基于摄动的

模糊聚类分析法

聚类分析是多元统计分析的一种，也是无监督模式识别的一个重要分支，在模

式分类图像处理和模糊规则处理等众多领域中获得最广泛的应用。它把一个没

有类别标记的样本按照某种准则划分为若干子集，使相似的样本尽可能归于一

类，而把不相似的样本划分到不同的类中。硬聚类把每个待识别的对象严格的划

分某类中，具有非此即彼的性质，而模糊聚类建立了样本对类别的不确定描述，

更能客观的反应客观世界，从而成为聚类分析的主流。

模糊聚类算法是一种基于函数最优方法的聚类算法，使用微积分计算技术求

最优代价函数，在基于概率算法的聚类方法中将使用概率密度函数，为此要假定

合适的模型，模糊聚类算法的向量可以同时属于多个聚类，从而摆脱上述问题。

我所学习的是模糊 C 均值聚类算法，要学习模糊 C 均值聚类算法要先了解虑

属度的含义，隶属度函数是表示一个对象 x 隶属于集合 A 的程度的函数，通常记

做μ

(x)，其自变量范围是所有可能属于集合 A 的对象（即集合 A 所在空间中的

所有点），取值范围是[0,1]，即 0<=μ

(x)<=1。μ

(x)=1 表示 x 完全隶属于集合

A，相当于传统集合概念上的 x∈A。一个定义在空间 X={x}上的隶属度函数就定

义了一个模糊集合 A，或者叫定义在论域 X={x}上的模糊子集

。对于有限个对

象 x

，x

，……，x

模糊集合

可以表示为：

A  {(



), x

) | x

 X }

(6.1)

有了模糊集合的概念，一个元素隶属于模糊集合就不是硬性的了，在聚类的

问题中，可以把聚类生成的簇看成模糊集合，因此，每个样本点隶属于簇的隶属

度就是[0，1]区间里面的值。

FCM 算法需要两个参数一个是聚类数目 C，另一个是参数 m。一般来讲 C 要

远远小于聚类样本的总个数，同时要保证 C>1。对于 m，它是一个控制算法的柔

性的参数，如果 m 过大，则聚类效果会很次，而如果 m 过小则算法会接近 HCM

聚类算法。

算法的输出是 C 个聚类中心点向量和 C*N 的一个模糊划分矩阵，这个矩阵表

示的是每个样本点属于每个类的隶属度。根据这个划分矩阵按照模糊集合中的最

大隶属原则就能够确定每个样本点归为哪个类。聚类中心表示的是每个类的平均

特征，可以认为是这个类的代表点。

从算法的推导过程中我们不难看出，算法对于满足正态分布的数据聚类效果会很

好，另外，算法对孤立点是敏感的。

聚类算法是一种比较新的技术，基于曾次的聚类算法文献中最早出现的

Single-Linkage 层次聚类算法是 1957 年在 Lloyd 的文章中最早出现的，之后

MacQueen 独立提出了经典的模糊 C 均值聚类算法，FCM 算法中模糊划分的概念最

早起源于 Ruspini 的文章中，但关于 FCM 的算法的详细的分析与改进则是由 Dunn

和 Bezdek 完成的。

模糊 c 均值聚类算法因算法简单收敛速度快且能处理大数据集，解决问题范

围广，易于应用计算机实现等特点受到了越来越多人的关注，并应用于各个领域。

算法描述

模糊 C 均值聚类算法的步骤还是比较简单的，模糊 C 均值聚类（FCM），即众

所周知的模糊 ISODATA，是用隶属度确定每个数据点属于某个聚类的程度的一种

聚类算法。1973 年，Bezdek 提出了该算法，作为早期硬 C 均值聚类（HCM）方法

的一种改进。

FCM 把 n 个向量 x

（i=1,2,…,n）分为 c 个模糊组，并求每组的聚类中心，

使得非相似性指标的价值函数达到最小。FCM 与 HCM 的主要区别在于 FCM 用模糊

划分，使得每个给定数据点用值在 0，1 间的隶属度来确定其属于各个组的程度。

与引入模糊划分相适应，隶属矩阵 U 允许有取值在 0，1 间的元素。不过，加上

归一化规定，一个数据集的隶属度的和总等于 1：



i1

 1,j  1,..., n

(6.9)

那么，FCM 的价值函数（或目标函数）就是式（6.2）的一般化形式：

m 2

J (U , c

,..., c

) 







， (6.10)

i1 i1 j

c c n

这里 u

介于 0，1 间；c

为模糊组 I 的聚类中心，d

=||c

-x

||为第 I 个聚类中

心与第 j 个数据点间的欧几里德距离；且

m 



1,



是一个加权指数。

构造如下新的目标函数，可求得使（6.10）式达到最小值的必要条件：

J (U , c

,..., c



,...,



)  J (U , c

,..., c

) 



j1



(



1)

i1

m 2











(



1)

i1 j j1 i1

c n n c

(6.11)

这里

，j=1 到 n，是（6.9）式的 n 个约束式的拉格朗日乘子。对所有输入参量

求导，使式（6.10）达到最小的必要条件为：

改进算法的思想是首先采用随机抽样的办法，从数据集中选取多个样本，

对每个样本应用 FCM 算法，将得到的结果作为初始群体，然后再利用遗传算

法对聚类结果进行优化，选取其中的最优解做为问题的输出，由于采样技术

显著的压缩了问题的规模，而遗传又可以对结果进行全局最优化处理，因此

在时间性能和聚类质量上都能获得较满意的结果。

遗传算法是美国 Michigon 大学的 John Holland 研究机器学习时创立的

一种新型的优化算法，它的主要优点是：遗传算法是从一系列点的群体开始

搜索而不是从单个样本点进行搜索，遗传算法利用适应值的相关信息，无需

连续可导或其他辅助信息，遗传算法利用转移概率规则，而非确定性规则进

行迭代，遗传算法搜索过程中，以对群体进行分化以实现并行运算，遗传算

法经过遗传变异和杂交算子的作用，以保证算法以概率 1 收敛到全局最优解

—具有较好的全局特性，其次遗传算法占用计算机的内存小，尤其适用计算

复杂的非线性问题。

遗传算法的设计部分

（1）种群中个体的确定

聚类的关键问题是聚类中心的确定，因此可以选取聚类中心作为种

群的个体，由于共有 C 个聚类中心，而每个聚类中心是一个 S 维的实数

向量，因此每个个体的初始值是一个 c*s 维的市属向量。

（2）编码

常用的编码方式有二进制与实数编码，由于二进制编码的方式搜索

能力最强，且交叉变异操作简单高效，因此采用二进制的编码方式，同

时防止在进行交叉操作时对优良个体造成较大的破坏，在二进制编码的

方式中采用格雷码的编码形式。

每个染色体含 c*s 个基因链，每个基因链代表一维的数据，由于原

始数据中各个属性的取值可能相差很大，因此需首先对数据进行交换以

统一基因链的长度，可以有以下两种变换方式。

1 扫描整个数据集，确定每维数据的取值范围，然后将其变换到同

一量级，在保留一定有效位的基础上取整，根据有效位的个数动态的计

算出基因链的长度。

2 对数据进行正规化处理，即将各维数据都变换到相同的区间，可

以算出此时的基因链长度为 10。

（3）适应度函数

由于在算法中只使用了聚类中心 V，而未使用虑属矩阵 u,因此需要

对 FCM 聚类算法的目标函数进行改进，以适用算法的要求，

和目标函数是等价的，由于遗传算法的

适用度一般取值极大，因此可取上式的倒数作为算法的使用度函数。

（4）初始种群的确定

初始种群的一般个体由通过采样后运行 FCM 算法得到的结果给出，

另外的一般个体通过随机指定的方法给出，这样既保证了遗传算法在运

算之初就利用背景知识对初始群体的个体进行了优化，使算法能在一个

较好的基础上进行，又使得个体不至于过分集中在某一取值空间，保证

了种群的多样性。

剩余20页未读，继续阅读

评论收藏

内容反馈

版权申诉

G11176593

粉丝: 6646
资源: 3万+

模糊C均值聚类算法的C++实现代码.pdf

局部模糊c均值聚类算法的matlab代码.zip

模糊C均值聚类算法的C++实现代码.docx

模糊C均值聚类算法MATLAB实现

模糊C均值聚类（FCM）,模糊c均值聚类算法的优缺点,matlab

基于MATLAB的FCM模糊C均值聚类算法的仿真+含代码操作演示视频

论文研究-广义均衡模糊C均值聚类算法.pdf

K-Means聚类算法java实现.pdf

基于改进遗传算法的加权模糊C均值聚类算法.pdf

模糊C均值聚类算法（Fuzzy C-Means , FCM）matlab实现.zip

C++均值聚类算法C++均值聚类算法C++均值聚类算法

IFCM：改进的区间值数据的模糊C-均值聚类算法[归纳].pdf

基于模糊C均值聚类算法的图像分割.ipynb

模糊C均值聚类算法的C 实现代码.doc

模糊C均值聚类算法

模糊C均值聚类（weka）

论文研究-软硬结合的快速模糊C-均值聚类算法的研究.pdf

[优质文档]模糊c均值聚类算法的c 实现代码.doc

模糊C均值聚类算法代码

win10环境下vscode运行opencv(C++)(解压即用)-1号包

虹软3.0人脸识别客户端（追踪，活体检测，人脸特征存储，人脸识别，人脸注册，人脸匹配）可离线断网部署 5000个免费key/年

c++入门，核心，提高讲义笔记

仿照Visionmaster，用C++、Qt编写的视觉软件

C++STL库常用库函数总结

c++小游戏 c++小游戏

mingw-w64-install.exe

C/C++中文帮助文档

我的世界简易版（C++编写，源代码+程序）

cmu 15445 2023spring project0

QT中利用TCP协议实现了一个多线程的文件互传系统

最新资源