没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
第 33卷 第 12期 控 制 与 决 策 Vol.33 No.12
2018年 12月 Control and Decision Dec. 2018
文章编号: 1001-0920(2018)12-2208-05 DOI: 10.13195/j.kzyjc.2017.1010
一种基于二部图谱划分的聚类集成方法
徐 森
1†
, 皋 军
1,2
, 徐秀芳
1
, 花小朋
1
, 徐 静
1
, 安 晶
1
(1. 盐城工学院 信息工程学院,江苏 盐城 224001;
2. 江苏省媒体设计与软件技术重点实验室(江南大学),江苏 无锡 214122)
摘 要: 将二部图模型引入聚类集成问题中, 使用二部图模型同时建模对象集和超边集, 充分挖掘潜藏在对象之
间的相似度信息和超边提供的属性信息. 设计正则化谱聚类算法解决二部图划分问题, 在低维嵌入空间运行 K -
means++算法划分对象集, 获得最终的聚类结果. 在多组基准数据集上进行实验, 实验结果表明所提出方法不仅能
获得优越的结果,而且具有较高的运行效率.
关键词: 机器学习;聚类分析;二部图模型;聚类集成;谱聚类算法
中图分类号: TP391 文献标志码: A
A cluster ensemble approach based on bipartite spectral graph
partitioning
XU Sen
1†
, GAO Jun
1,2
, XU Xiu-fang
1
, HUA Xiao-peng
1
, XU Jing
1
, AN Jing
1
(1. School of Information Engineering,Yancheng Institute of Technology,Yancheng 224001,China;2. Jiangsu Key
Laboratory of Media Design and Software Technology(Jiangnan University),Wuxi 214122,China)
Abstract: A bipartite graph model is brought into the cluster ensemble problem. The object set and hyperedge set are
modeled simultaneously via a bipartite graph for mulation considering the similarity among instances and the information
provided by hyperedges collectively. A normalized spectral clustering algorithm is proposed to solve the bipartite g raph
partitioning problem, and the final clustering result is attained by performing K-means++ algorithm to partition object set
embedded in low dimensional space. Experimental results on several baseline datasets show that the proposed approach
is not only well-performed but also high efficient.
Keywords: machine learning;cluster analysis;bipartite graph model;cluster ensemble;spectral clustering algorithm
0 引
聚类集成具有传统聚类算法无可比拟的优势,
其关键问题在于如何将聚类成员组合为更加优越的
聚类结果
[1]
. 解决聚类集成问题最常见的方法是引入
超图的邻接矩阵 H 表示对象之间的两两关系, 避免
簇标签对应问题. 根据处理的矩阵可以分为对 H 进
行处理的方法
[1-3]
和对相似度矩阵 S 进行处理的方
法
[1,4-10]
. 对 H 进行处理的方法虽然利用了簇标签提
供的属性信息, 但忽略了对象之间的关系; 对 H 进行
处理的方法揭示了对象之间的关系, 但未能有效利用
簇标签提供的属性信息.
本文引入二部图模型
[11]
解决聚类集成问题, 使
用二部图同时建模对象集和超边集, 充分挖掘潜藏
在对象之间的相似度信息和超边/簇提供的属性信
息. 通过正则化谱聚类算法解决二部图划分问题,
得到对象的低维嵌入, 在低维空间使用 K-means++
(KM++)
[12]
算法划分对象集, 从而获得最终的聚类结
果. 在多组基准数据集上的实验结果验证了所提出
算法的有效性.
1 聚类集成相关研究
聚类集成主要研究以下两个问题: 1) 聚类成员
生成问题, 即如何生成具有差异性的聚类成员; 2) 共
识函数设计问题/聚类集成问题, 即如何将聚类成员
收稿日期: 2017-07-27;修回日期: 2017-12-26.
基金项目: 国家自然科学基金项目(61375001);江苏省自然科学基金项目 (BK20151299);江苏省333工程项目;江
苏省高等学校自然科学研究项目(18KJB520050);江苏省媒体设计与软件技术重点实验室开放课题项目
(18ST0201).
责任编委: 陈虹.
作者简介: 徐森 (1983−), 男, 副教授, 博士, 从事机器学习及其应用等研究;皋军(1971−), 男, 教授, 博士, 从事机器
学习及其应用等研究.
†
通讯作者. E-mail: xusen@ycit.cn
资源评论
weixin_38562725
- 粉丝: 3
- 资源: 931
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功