聚类分析原理及步骤
聚类分析原理及步骤
1、什么是聚类分析?聚类分析也称群分析或点群分析,它是研究多要素
事物分类问题的数量方法,是一种新兴的多元统计方法,是当代分类学与
多元分析的结合。其基本原理是,根据样本自身的属性,用数学方法按照
某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲
疏关系程度对样本进行聚类。聚类分析是将分类对象置于一个多维空问
中,按照它们空问关系的亲疏程度进行分类。通俗的讲,聚类分析就是根
据事物彼此不同的属性进行辨认,将具有相似属性的事物聚为一类,使得
同一类的事物具有高度的相似性。聚类分析方法,是定量地研究地理事物
分类问题和地理分区问题的重要方法,常见的聚类分析方法有系统聚类
法、动态聚类法和模糊聚类法等。2、聚类分析方法的特征(1)、聚类分
析简单、直观。(2)、聚类分析主要应用于探索性的研究,其分析的结果
可以提供多个可能的解,选择最终的解需要研究者的主观判断和后续的分
析。(3)、不管实际数据中是否真正存在不同的类别,利用聚类分析都能
得到分成若干类别的解。(4)、聚类分析的解完全依赖于研究者所选择的
聚类变量,增加或删除一些变量对最终的解都可能产生实质性的影响。
(5)、研究者在使用聚类分析时应特别注意可能影响结果的各个因素。
(6)、异常值和特殊的变量对聚类有较大影响,当分类变量的测量尺度不
一致时,需要事先做标准化处理。3、聚类分析的发展历程在过去的几年
中聚类分析发展方向有两个:加强现有的聚类算法和发明新的聚类算法。