系统聚类分析方法
系统聚类分析方法是研究多要素事物分类问题的数量方法。其根本原理是根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进展聚类。
聚类分析方法有多种,常见的有系统聚类法、动态聚类法和模糊聚类法等。
在聚类分析中,需要对聚类要素的数据进行处理,常用的方法有总和标准化、标准差标准化、极大值标准化和极差标准化等。
距离计算是系统聚类分析的依据和根底,常用的距离计算方法有绝对值距离、欧几里德距离、曼哈顿距离等。在地理分区和分类研究中,往往采用几种距离进展计算、比照,选择一种较为适宜的距离进展聚类。
直接聚类法是根据距离矩阵的构造一次并类得到结果。其根本步骤是:①把各个分类对象单独视为一类;②根据距离最小的原那么,依次选出一对分类对象,并成新类;③如果其中一个分类对象已归于一类,那么把另一个也归入该类;④如果一对分类对象正好属于已归的两类,那么把这两类并为一类;每一次归并,都划去该对象所在的列与列序一样的行;⑤那么,经过 m-1 次就可以把全局部类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。
直接聚类法虽然简便,但在归并过程中是划去行和列的,因而难免有信息损失。因此,直接聚类法并不是最好的系统聚类方法。
最短距离聚类法是在原来的 m×m 距离矩阵的非对角元素中找出最小者,把分类对象 Gp 和 Gq 归并为一新类 Gr,然后按计算公式计算原来各类与新类之间的距离,这样就得到一个新的〔m-1〕阶的距离矩阵;再从新的距离矩阵中选出最小者 dij,把 Gi 和 Gj 归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。
系统聚类分析方法可以广泛应用于各个领域,如经济学、社会学、生物学、环境科学等。它可以帮助研究人员对复杂的数据进行分类和分析,从而揭示隐藏在数据背后的规律和关系。