没有合适的资源?快使用搜索试试~ 我知道了~
摘要第 1 章 介绍第 2 章FUZZY c-MEANS 算法隶属度函数 .K 均值聚类算法.模糊 C 均值聚类 .采样与非迭代扩展.基于权重的模糊 C 均值算
资源详情
资源评论
资源推荐
目录
摘要 I
第 1 章 介绍 1
第 2 章 FUZZY c-MEANS 算法 2
2.1 隶属度函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2 K 均值聚类算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.3 模糊 C 均值聚类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.3.1 FCM 思想 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.3.2 FCM 算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
第 3 章 FUZZY c-MEANS 算法扩展 4
3.1 采样与非迭代扩展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.1 resFCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.2 基于权重的模糊 C 均值算法 . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.2.1 wFCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.2.2 spFCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2.3 oFCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2.4 brFCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3 基于核的改进的模糊 C 均值算法 . . . . . . . . . . . . . . . . . . . . . . 7
3.3.1 FCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3.2 wkFCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.3.3 rsekFCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.3.4 spkFCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.3.5 okFCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
第 4 章 复杂度对比 11
4.1 理论复杂度对比 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2 复杂度实验测试 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
第 5 章 代码实现 13
参考文献 14
A 附录一 15
Fuzzy c-Means Learning Report
第 1 章 介绍
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚
类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他
簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分
类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。
聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划
分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类
法、模糊聚类法、图论聚类法、聚类预报法等。在数据挖掘中,聚类也是很重要的一个
概念。
聚类被用作一个预处理步骤,作为一个知识抽取的工具,将数据分为可管理的部分。
聚类或聚类分析是一种探索性数据分析的形式,在这种分析中,数据被分成若干组或子
集,从而使每组中的对象具有某种相似性。
传统的聚类分析计算方法主要有如下几种:1. 划分方法;2. 层次方法;3. 基于密
度的方法;4. 基于网格的方法;5. 基于模型的方法。
大规模数据聚类主要有两种方法:基于不同增量样式的分布式聚类和通过渐进或随
机抽样找到的样本聚类。两种方法都已应用于大规模数据的 FCM 聚类算法中,这些方
法也被应用在 GMM(Gaussian-mixture-model)算法和 EM(expectation–maximization)
算法中。这两种算法都为实现“可加载数据的加速和不可加载数据的近似”提供了有用
的方法。
考虑一个 n 个实体的集合:O = {o
1
, o
2
, · · · , o
n
},每个实体被一个数值的特征向量
所表示:X = {x
1
, x
2
, · · · , x
n
} ⊂ R
d
。一个实体的划分被定义为 cn = {u
ik
},u
ik
代表实
体 o
i
属于第 k 类的概率。c-partition 通常被表示为一个 c × n 的矩阵 U = [u
ik
]。
1
Fuzzy c-Means Learning Report
第 2 章 FUZZY c-MEANS 算法
FCM 算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象
之间相似度最大,而不同簇之间的相似度最小。模糊 C 均值算法是普通 C 均值算法的
改进,普通 C 均值算法对于数据的划分是硬性的,而 FCM 则是一种柔性的模糊划分。
2.1 隶属度函数
隶属度函数 是表示一个对象 x 隶属于集合 A 的程度的函数,通常记作 µ
A
(x)。其自
变量范围是所有可能属于集合 A 的对象,取值范围是 [0, 1],即 0 ≤ µ
A
(x) ≤ 1。µ
A
(x) = 1
表示 x 完全隶属于集合 A,相当于传统集合概念上的 x ∈ A。
2.2 K 均值聚类算法
K 均值聚类(K-Means),即众所周知的 C 均值聚类。它的核心思想为:算法把 n
个向量 x
j
(i = 1, 2, · · · , n ) 分为 c 个分类 v
i
(i = 1, 2, · · · , c ),并求每组的聚类中心,使得
非相似性(或距离)指标的价值函数(或目标函数)达到最小。目标函数可定义为:
J
m
(U, V ) =
c
i=1
n
j=1
∥X
j
− V
i
∥
2
A
(2.1)
算法实现主要步骤:
步骤 1:随机确定 k 个初始点作为质心。
步骤 2:对数据集中的每个数据点找到距离最近的簇。
步骤 3:对于每一个簇,计算簇中所有点的均值并将均值作为质心。
步骤 4:重复步骤 2,直到任意一个点的簇分配结果不变。
2.3 模糊 C 均值聚类
模糊 C 均值聚类(FCM),即众所周知的模糊 ISODATA,是用隶属度确定每个数
据点属于某个聚类的程度的一种聚类算法。1973 年,Bezdek 提出了该算法,作为早期
硬 C 均值聚类(HCM)方法的一种改进。
2.3.1 FCM 思想
1. FCM 算法的目标函数为:
J
m
(U, V ) =
c
i=1
n
j=1
u
m
ij
∥X
j
− V
i
∥
2
A
(2.2)
2
剩余11页未读,继续阅读
晕过前方
- 粉丝: 113
- 资源: 328
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0