第二节 模糊聚类分析方法
在科学技术、经济管理中常常要按一定的标准(相似程度或亲疏关系)进行
分类。例如,根据生物的某些性状可对生物分类,根据土壤的性质可对土壤分
类等。对所研究的事物按一定标准进行分类的数学方法称为聚类分析,它是多
元统计“物以类聚”的一种分类方法。由于科学技术、经济管理中的分类界限往
往不分明,因此采用模糊聚类方法通常比较符合实际。
一、模糊聚类分析的一般步骤
1、第一步:数据标准化
[9]
(1) 数据矩阵
设论域 为被分类对象,每个对象又有 个指标表示其性状,
即
,
于是,得到原始数据矩阵为
。
其中 表示第 个分类对象的第 个指标的原始数据。
(2) 数据标准化
在实际问题中,不同的数据一般有不同的量纲,为了使不同的量纲也能进行
比较,通常需要对数据做适当的变换。但是,即使这样,得到的数据也不一定
在区间 上。因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将
数据压缩到区间 上。通常有以下几种变换:
① 平移·标准差变换