论文研究-基于自适应权重的模糊C-均值聚类算法.pdf

所需积分/C币:19 2019-07-22 19:56:57 946KB .PDF

针对模糊C-均值聚类算法过度依赖初始聚类中心的选取, 从而易受孤立点和样本分布不均衡的影响而陷入局部最优状态的不足, 提出一种基于自适应权重的模糊C-均值聚类算法。该算法采用高斯距离比例表示权重, 在每一次迭代过程中, 根据当前数据的聚类划分情况, 动态计算每个样本对于类的权重, 降低了算法对初始聚类中心的依赖, 减弱了孤立点和样本分布不均衡的影响。实验结果表明, 该算法是一种较优的聚类算法, 具有更好的健壮性和聚类效果。
第8期 任丽娜,等:基于自适应权重的模湖C-均值聚类算法 2851 新聚类中心c 算法与 SAWFCM算法在相同迭代次数的条件下10次平均聚 g)若聚类趋于稳定或迭代次数超过阈值,则算浤结束输出结朱,秃 则转至步骤c)。 类结果的收敛情况,实验结果如图23所示。 ◆ 2.4迭代控制 SAWFCM算法十要通过判定样本集与各类的均方差是否 趋于稳定来停止迭代,可以根据文献[lO的迭代控制思想来 度量相邻迭代步中的均方差变化 (11) 其中:an表示迭代步t得到的聚类结果中样本集与各类的均 1101214162026304060101214162026304060 方差,设c和C为迭代步t得到的第k类的聚类中心和样本 ◆ SAWFCM HFCM ◆ SAWFCM -HFCM 集,则有 图2lrs运行效果 3I 3 Breast cancer Wisconsin 运行效果测试结果 从图2、3中可以看出,虽然FCM算法较快地收敛到一个 ∑,c4√(x1-c1) 木的不均匀分布的影响而陷入了局部最优的状态,而SAWF- 在具体实验中,设当d<10-时聚类结果稳定,迭 42(1)稳定的聚类状态但是却由于受到初始聚类屮心孤立点或样 停止。CM算法可以降低上述FCM算法的不足,以较快的度得到较 优的聚类效果。 3实验结果与分析 4结束语 为了验证 SAWFCM算法的性能,实验采用了UCI标准数 据集对改进算法的聚类效果进行测试。表1展示了文所 通过对传统FCM算法的分析易知,该算法易受初始聚类 采用的数据集的基本信息。 中心和初始隶属矩阵的影响而陷入局部最优,又易受孤立点和 表1UCI数据集基本信息 样本分布不均衡的影响。而本文根据高斯距离所具有的密度 数据集 样本点个数 维数 性质,提出·种基于自适应权重的模糊C-均值娶类算法。新 Glass identification 聚类算法根据每次迭代的聚类结果动态地确定下一次迭代聚 类中样木关于类的权重,并以此改进原始FCM算法对于初始 Brcast cancer wisconsin lanosol 4946 Labot Hepatitis 22222 聚类中心和隶属矩阵的依赖,从而使权重的选择更加科学,粲 类的结果更加精确。 SAWFCM算法是一种基于标函数的聚 类算法,同传统的聚类算法一样,同样存在计算大数据量费时 Diabe 的问题,这个问题可以通过在此算法上采取分割数据集实现动 3.1标准数据集实验结果 态增量式聚类解决 实验将应用基本的FCM算法和 SAWFCM算法对每个UC参考文献 数据集进行20次聚类,并将FCM算法和 SAWFGM算法相对1Ma( QUEEN J. Some methods for classification and analysis of 于齐淼等人提出的 SWFCYⅥ算法5,在聚类的准确率上进行比 variate observation C//Proc of the 5th Berkeley Symposium on 较,结果如表2所示 Mathematical Statistics and Probability. 1967: 281-297 表2FCM、 SWFCM与 SAWFGM算法的性能北较 [2]高新波.模糊聚类分析及其应用[Ⅵ].西安:西安电子科技大学出 数据集 UM算法 SWFCM算法 sAW上CM 版社,2003 准确率 准确率/% 算法准确率/% [3 BEZDEK J C. Pattern recognition with fuzzy objective function algo- rithms M. New York: Plenum Press, 1981: 10-18 Breast cancer. W [4』严骏.模糊聚类算法应用研究[D].杭州:浙江大学,206 Lonosph 70.940 72.085 [5]齐淼,张化垟改进的模糊C-均值聚英算決研究[J].计算杌工程 193 78.912 与应用,2009,45(20):133-135 [6]朱林,王士冋,赵红,等,改进模糊划分的FCM聚类算法的一般 Diabetes 66.146 77.7U 化研究[冂.计算机研究与发展,2009,46(5):814822 从喪2的实验结果中可以看出,本文中所提岀的sAw·[7]魏娜,王建勋,兰文祥,等.无监督多尺庋模糊聚类算法研究[J] CM算法比传统的FCM算法在整体聚类精度上有很大提高,该 空军「程大学学报:自然科学版,2011,12(1):78-82 算法相较于 SWFCM算法也具有较高的性能,特别在 Hepatitis8 GRAVES D, PEDRYCZ W. Kernel-based fuzzy clustering and fuzzy 和 Diabetes两个数据集上可以看出 SWFCM算法在准确率上 lustering: a comparative experimental study [i]. Fuzzy Sets and 等于或低于FCM算法,而木文的 SAWFCM算法则高于两种算 Systems,2010,161(4):522-532 [9郑超,苗夲搛,王睿智,等.基于密庹加权的粗糙K-均值聚类改进 法。对UCⅠ上的多个公共数据集进行聚类分析应用发现 算法「J1.计算机科学,2009,36(3):220- SAWFCM算法的稳定性高于FCM算法。总体上讲, CAWFCM[10]周杨,苗夺谦,岳晓冬基于自适应权重的粗K-均值聚类算法 算法具有吏好的聚类效果与稳定性,算法的健壮性也更强。 [冂].计算科学,2011,38(6):237-242 3.2算法运行效果比较分析 [11 PAL N R, BEZDEK J C On cluster validity for the fuzzy C-means nodel[ J. IEEE Trans on Fuzzy systems, 1995, 3 (3): 370-379 为了验让改进后算法的效率限于篇幅有限,本文取聚类[2 UCI machine learming database[ DB/OL].hp: archive. ics.uei 的经典数据集Iris和 Breast cancer wisconsin为例,比较CM edu/ml/

...展开详情
试读 3P 论文研究-基于自适应权重的模糊C-均值聚类算法.pdf
img

关注 私信 TA的资源

上传资源赚积分,得勋章
    最新推荐
    论文研究-基于自适应权重的模糊C-均值聚类算法.pdf 19积分/C币 立即下载
    1/3
    论文研究-基于自适应权重的模糊C-均值聚类算法.pdf第1页

    试读已结束,剩余2页未读...

    19积分/C币 立即下载 >