摘要:模糊聚类是一种重要数据分析和建模的无监督方法。本文对模糊聚类进行了概述,从
理论和实验方面研究了模糊 c 均值聚类算法,并对该算法的优点及存在的问题进行了分析。
该算法设计简单,应用范围广,但仍存在容易陷入局部极值点等问题,还需要进一步研究。
Fuzzy c-Means Clustering Algorithm and Implementation
Abstract: Fuzzy clustering is a powerful unsupervised method for the analysis of data
and construction of models.This paper presents an overview of fuzzy clustering and
do some study of fuzzy c-means clustering algorithm in terms of theory and
experiment.This algorithm is simple in design,can be widely used,but there are still
some problems in it,and therefore,it is necessary to be studied further.
Key words: fuzzy c-Mean algorithm;fuzzy clustering;clustering analysis
20 世纪 90 年代以来,随着信息技术和数据库技术的迅猛发展,人们可以非
常方便地获取和存储大量的数据。但是,面对大规模的数据,传统的数据分析工
具只能进行一些表层的处理,比如查询、统计等,而不能获得数据之间的内在关
系和隐含的信息。为了摆脱“数据丰富,知识贫乏”的困境,人们迫切需要一种
能够智能地、自动地把数据转换成有用信息和知识的技术和工具,这种对强有力
数据分析工具的迫切需求使得数据挖掘技术应运而生。
将物理或抽象对象的集合分组成由类似的对象组成的多个类的过程称为聚
类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼
此相似,与其它簇中的对象相异。
聚类是一种重要的数据分析技术,搜索并且识别一个有限的种类集合或簇集
合,进而描述数据。聚类分析作为统计学的一个分支,己经被广泛研究了许多年。