这个是最终完成的对鸢尾花数据进行聚类运行方法如下:
因为本程序使用的是绝对路径,所以首先要把 iris.txt 放到 D 盘下。
1. 点击菜单下的“生成聚类中心”,界面上就会显示目前生成了几个聚类中心,以及聚类中
心号,
2. 点击“完成聚类”,可以将聚类的结果保存到记事本中,
如果想对结果进行分析的话可以将结果复制到 excel 中进行分析。
最大最小距离聚类的思想是
① 选任意一模式样本做为第一聚类中心 Z1。
② 选择离 Z1 距离最远的样本作为第二聚类中心 Z2。
③ 逐个计算各模式样本与已确定的所有聚类中心之间的距离,并选出其中的最小距离。例
当聚类中心数 k=2 时,计算
min( Di1 , Di2 ),i=1,…,N
(
N
个最小距离)
④ 在所有最小距离中选出最大距离,如该最大值达到的一定分数比值( 阈值 T ) 以上(在这
里取 1/3),则相应的样本点取为新的聚类中心,返回③;否则,寻找聚类中心的工作结束
⑤ 重复步骤③④,直到没有新的聚类中心出现为止。
⑥ 将样本 按最近距离划分到相应聚类中心对应
的类别中。
2010.7.1