K-means-聚类算法研究综述.docx资源-CSDN文库

版权申诉

kmeans

聚类

194 浏览量 2021-09-13 19:58:09 上传评论收藏 150KB DOCX 举报

资源推荐

资源详情

资源评论

K-means 聚类算法研究综述

摘要:总结评述了 K-means 聚类算法的研究现状，指出 K-means 聚类算法是一个 NP 难优化问题，无法获得全局最优。介绍

了 K-means 聚类算法的目标函数，算法流程，并列举了一个实例，指出了数据子集的数目 K，初始聚类中心选取，相似性

度量和距离矩阵为 K-means 聚类算法的 3 个基本参数。总结了 K-means 聚类算法存在的问题及其改进算法，指出了 K-means

聚类的进一步研究方向。

关键词：K-means 聚类算法；NP 难优化问题；数据子集的数目 K；初始聚类中心选取；相似性度量和距离矩阵

Review of K-means clustering algorithm

Abstract: K-means clustering algorithm is reviewed. K-means clustering algorithm is a NP hard optimal problem and global

optimal result cannot be reached. The goal， main steps and example of K-means clustering algorithm are introduced. K-means

algorithm requires three user-specified parameters: number of clusters K， cluster initialization， and distance metric.

Problems and improvement of K-means clustering algorithm are summarized then. Further study directions of K-means

clustering algorithm are pointed at last.

Key words: K-means clustering algorithm; NP hard optimal problem; number of clusters K; cluster initialization; distance metric

K-means 聚类算法是由Steinhaus 1955 年、Lloyed 1957

年、Ball & Hall 1965 年、McQueen 1967 年分别在各自的

不同的科学研究领域独立的提出。K-means 聚类算法被提出

来后，在不同的学科领域被广泛研究和应用，并发展出大量

不同的改进算法。虽然K-means 聚类算法被提出已经超过

距离判断准则，计算该类内各点到聚类中心



的距离平方

和

（1）



J(c ) 

x 



x C



聚类目标是使各类总的距离平方和 (C) 

(c ) 最

k1

小。

50 年了，但目前仍然是应用最广泛的划分聚类算法之一。

[ ]



 



d x  

J(c ) 

x  



容易实施、简单、高效、成功的应用案例和经验是其仍然流

行的主要原因。

k1

k1 x C

k1 i1

（2）

文中总结评述了K-means 聚类算法的研究现状，指出

K-means 聚类算法是一个NP 难优化问题，无法获得全局最

优。介绍了K-means 聚类算法的目标函数、算法流程，并

列举了一个实例，指出了数据子集的数目 K、初始聚类中

心选取、相似性度量和距离矩阵为K-means 聚类算法的3

个基本参数。总结了K-means 聚类算法存在的问题及其改

进算法，指出了K-means 聚类的进一步研究方向。

1 若 

x c



，

显然，根据最小二乘

其中，d



0 若 

x c



法和拉格朗日原理，聚类中心



应该取为类别

类各数

据点的平均值。

K-means 聚类算法从一个初始的K 类别划分开始，然

后将各数据点指派到各个类别中，以减小总的距离平方和。

因为K-means 聚类算法中总的距离平方和随着类别个数K

 n

时，

1 经典 K-means 聚类算法简介

的增加而趋向于减小（当K

。因此，

1.1 K-means 聚类算法的目标函数

总的距离平方和只能在某个确定的类别个数K 下，取得最

小值。

对于给定的一个包含n 个 d 维数据点的数据集

X {x ,x ,,x ,,x }

，其中 

，以及要生成

1.2 K-means 算法的算法流程

的数据子集的数目K，K-means 聚类算法将数据对象组织为

K-means 算法是一个反复迭代过程,目的是使聚类域中

K 个划分C {c ,i 1,2, K}。每个划分代表一个类

，

所有的样品到聚类中心距离的平方和J

(C)

最小，算法流程

每个类

有一个类别中心



。选取欧氏距离作为相似性和

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余4页未读，立即下载

评论收藏

内容反馈

版权申诉

苦茶子12138

粉丝: 1w+
资源: 6万+

K-means-聚类算法研究综述.docx

k-means 聚类算法研究综述.docx

基于k-means二维聚类算法，有文档

论文研究-基于k-means聚类算法的研究 .pdf

基于改进粒子群和K-Means的文本聚类算法研究.pdf

K-Means聚类算法java实现.pdf

K-means 聚类算法研究综述

K_means聚类算法研究综述

K_means聚类算法的研究

k—means 聚类算法

聚类算法K-means

基于Matlab实现K-means和FCmeans聚类分析源码.zip

K-Means聚类算法研究综述_杨俊闯.pdf

论文研究-最大距离法选取初始簇中心的K-means文本聚类算法的研究.pdf

论文研究-结合语义改进的K-means短文本聚类算法.pdf

k-means聚类算法

大数据挖掘中的K-means无监督聚类算法的改进.pdf

数据挖掘-K-Means聚类-算法原理.pdf

K-means实现广告聚类分析.zip

k - means聚类分析算法

论文研究-粒子群K-means聚类算法的改进.pdf

毕业设计：基于噪声数据集处理的K-means聚类算法实现.zip

实验五 K-Means聚类算法.ipynb

k-means及Isodata 聚类算法的实现

K-means聚类算法研究及应用.

最新资源