没有合适的资源?快使用搜索试试~ 我知道了~
计算机研究 -谱聚类算法研究.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 9 浏览量
2022-07-01
22:00:55
上传
评论
收藏 8.35MB PDF 举报
温馨提示
试读
45页
计算机研究 -谱聚类算法研究.pdf
资源推荐
资源详情
资源评论
Abstract
Clustering
analysis
is
the
classic
problem
in
machine
learning.Clustering
can
be
divided
into
unsupervised
clustering
and
semi-supervised
clustering.Unsupervised
clustering
extracts
potential
structure
of
data,groups
the
similar
data
into
the
same
cluster
without
any
prior
and
assumption
information.In
the
existing
unsupervised
clustering
algorithms,k-means
clustering
is
the
popular
and
simple
clustering
algorithm.K—means
clustering
has
a
good
performance
in
the
spherical
distribution
data.But
k-means
clustering
tends
to
failure
in
the
non-context
data.And
k-means
clustering
uses
iterative
optimization
method
to
find
optimal
solution,thus
Call’t
guarantee
converge
to
the
global
optimal
solution.
Spectral
clustering
is
an
unsupervised
clustering
algorithm
appearing
recently.Spectral
clustering
overcomes
the
shortcoming
of
k-means
clustering.Spectral
clustering
can
recognize
non—convex
distribution
clustering,is
suitable
to
practical
problems.Specual
clustering
shouldn’t
get
local
optimal
solution,and
can
avoid
singular
problem
caused
by
the
extra
dimension
of
data.In
this
papeL
we
do
two
aspects
research
based
on
spectral
clustering
algorithm
1.we
propose
a
clustering
algorithm
hierarchical
spectral
clustering(HSC).The
proposed
HSC
algorithm
absorbs
higher
clustering
accuracy
of
hierarchical
clustering
and
avoids
skewed
divisions
because
of
using
spectral
clustering.Experimental
results
show
that
the
proposed
hierarchical
spectral
clustering
is
superior
to
spectral
clustering
or
hierarchical
clustering
on
cluster
quality
and
is
superior
to
hierarchical
clustering
on
computational
speed
2.we
propose
a
spectral
clustering
based
on
affinity
propagation.This
clustering
algorithm
use
the
dimension
reduction
characteristics
of
spectral
clustering
to
obtain
the distribution
of
data
in
the
mapping
space,then
do
affinity
propagation
clustering
on
samples
in
mapping
space.This
method
provide
dimension
and
tightened
input
for
affinity
propagation
clustering
through
spectral
mapping.And
affinity
propagation
algorithm
can
fast
coverage
to
global
optimization
solution
and
not
sensitive
to
the
initiation
The
clustering
results
based
on
MPEG-7
database
and
the
subset
show
the
good
performance
of
the
spectral
clustering
based
on
affinity
propagation
KEY
WORDS:image
clustering,hierarchical
clustering,spectral
clustering,affinity
propagation
III
IV
§1.1研究背景和意义
第一章绪论
聚类问题一直是机器学习和模式识别领域一个比较活跃而且极具挑战性的研究方
向,近几年产生了大量的解决该问题的相关算法。现有的基于产生式模型的聚类方法由
于要估计参数密度,就必须将问题的模型简化,如假设每一类都是高斯分布。这使得算
法仅在凸形结构的数据上有好的效果,不适于具有任意分布的复杂形式的聚类问题。其
次,由于对数似然存在局部最小值,因而在获得满意聚类的同时不得不尝试几种初始结
构。其他算法如基于中心的聚类算法(代表性的有K一均值算法),在超球形分布的数据
集合上有很好的性能,不适于任意形状聚类;并且算法利用迭代优化方法寻找最优解,
不能保证收敛到全局最优解。
新近出现的一种无监督聚类算法一谱聚类克服了K一均值算法的缺点,具有识别非
凸分布聚类的能力,适合于求解实际问题,而且实现简单,不会陷入局部最优解,且能
避免数据的过高维数所造成的奇异性问题。该方法建立在谱图理论基础之上,利用数据
相似性矩阵的特征向量进行聚类,因而统称谱聚类。谱聚类算法是一种基于两点问相似
关系的方法【l】,这使得该算法适用于非测度空间。谱聚类算法又是一个判别式方法,不
用对数据的全局结构作假设,而是首先收集局部信息来表示两点属于同一类的可能性,
然后根据某一聚类准则做全局决策,将所有数据点划分到不同的数据集合中。通常这样
的准则可以在一个嵌入空间中得到解释,该嵌入空间是由数据矩阵的某几个特征向量张
成的。谱方法成功的原因在于:通过特征分解,可以获得聚类准则在放松了的连续域中
的全局最优解。目前,谱聚类算法已被成功应用于语音识别121、视频分割p】、图像分割
[41、VLSI设计151、网页划分‘61等领域。
尽管谱聚类方法取得了很好的效果,然而现在仍处于发展初期,算法本身仍存在许
多值得深入研究的问题。我们首先简要介绍了谱聚类算法目前所取得的研究成果,然后
分析了该类算法在图像应用中存在的一些问题,最后针对原始谱聚类算法的缺点,对其
做了改进,提出了两种改进算法。
§1.2谱聚类的研究现状
谱图划分‘7州准则诞生了谱聚类的实践,是一个受欢迎的功能强大的计算方法【9】。
它将数据聚类问题看成是一个无向图的多路划分问题。将数据点作为无向图仅以历的
顶点∥,边权重的集合z={形}表示两点间的相似性,/4I表示待聚类数据点间的相似性
矩阵,将其看作是该无向图的邻接矩阵,它包含了聚类所需要的所有信息。然后定义一
个划分准则,优化这一准则的目的是使同一类内的点具有较高的相似性,而不同类之间
的点具有较低的相似性。
在理论上,文献[8]首先将相似矩阵的特征向量(矩阵谱分析理论)与图的划分问题
结合起来,并取得了很好的效果。文献[7]论证了图的两分划问题与拉普拉斯矩阵的第
二个最大特征值对应的特征向量有紧密的联系,并验证了将此特征向量运用于图的两分
划的问题是可行的。在实际应用中,文献[10]通过深入的分析,发现了聚类问题、图划
分问题和相似矩阵的特征向量之间的紧密关系,提出了的率切准则,该准则通过引入类
规模平衡项来最小化类间相似度,最大化类内相似度。通过分析矩阵谱理论建立了相应
的聚类算法,并最终将其算法用于超大规模集成电路设计中。
文献[11]将像素作为顶点,根据像素的亮度和空间位置确定连接像素点间边的权值,
利用谱图理论设计建立了2-way划分的Ncut目标函数来迭代进行图的分割,最优化这
一准则,不仅能够衡量类内样本间的相似程度,也能衡量类间样本间的相异程度,实现
了谱聚类方法在图像聚类中的应用。
文献[123通过在不规则图上进行多路图划分的谱松散模型分析,提出了运用多路
Min—Max和多路Ncut两种不同目标函数设置的下限值,同时通过分析单个特征向量的
代数结构或对应于最优解的特征空间,很好的解决了谱图理论在多路图划分问题中的应
用。
文献[13]将把相似性解释为在Markov随机游走中的边流,研究游走的转移概率矩
阵的特征值和特征向量,这一解释说明了谱聚类方法具有一定的概率基础。并且利用随
机游动对Ncut进行了概率的解释,提出了基于随机游动的新算法。同时,借助于这一
概率解释提出了多个特征相似矩阵组合下的谱聚类方法,并进行了图像分割实验证明了
其有效性。文献[14]利用矩阵的扰动理论分析了谱聚类算法,并给出了谱聚类算法在一
般情况下成功的条件。
文献[15]和文献[16]对于两分划图G=(Z只叨上的谱聚类做了研究。两分划图是
2
剩余44页未读,继续阅读
资源评论
programyp
- 粉丝: 87
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功