基于谱图和成对约束的主动半监督聚类算法资源-CSDN文库

173 浏览量 2021-01-14 15:26:26 上传评论收藏 207KB PDF 举报

资源推荐

资源详情

资源评论

第 28 卷第 6 期

Vol. 28 No. 6

控制与决策

Control and Decision

2013 年 6 月

Jun. 2013

基于谱图和成对约束的主动半监督聚类算法

文章编号: 1001-0920 (2013) 06-0904-05

蒋伟进

1,2

, 许宇晖

, 王欣

(1. 湖南商学院计算机与信息工程学院，长沙 410205；2. 武汉理工大学计算机科学与

技术学院，武汉 430070；3. 湖南工业大学电气自动化学院，湖南株洲 412008)

摘要: 针对半监督聚类学习算法中缺乏主动学习的缺陷, 提出一种纠错式主动学习成对约束方法. 算法通过寻找

一般聚类算法自身难以发现的成对约束信息, 同时避免这部分约束信息之间本身的关系, 将其引入谱聚类算法, 利用

该监督信息调整谱聚类中点与点之间的距离矩阵对两点间距离进行排序, 采用双向寻找的方法, 使得学习器即使接

收到没有标记的数据也能进行主动学习. 实验分析表明, 所提出算法能够获得较为满意的聚类效果.

关键词: 半监督聚类；主动式学习；成对约束；谱聚类

中图分类号: TP273 文献标志码: A

Active semi-supervised clustering algorithm based-on pair-wise

constraints

JIANG Wei-jin

1,2

, XU Yu-hui

, WANG Xin

(1. School of Computer and Information，Hu’nan University of Commerce，Changsha 410205，China；2. School of

Computer Science and Technology，Wuhan University of Technology，Wuhan 430070，China；3. School of Electric

Automatization，Hu’nan University of Technology，Zhuzhou 412008，China. Correspondent：JIANG Wei-jin，E-mail:

nudtjwj@163.com)

Abstract: An active learning algorithm based on pair-wise constraints with error correction is proposed in this paper. The

algorithm searches the pair-wise constraints information that the clustering algorithm cann’t ﬁnd, and tries its best to reduce

the connections between these constraint informations, which is used in the spectral clustering. The suppervised information

is used to adjust the distance matrix in the spectral clustering, and the distances are sorted. The learninger can study actively

when the learinger receives the data without ﬂags by using the two-way search method. Experiment analysis shows that

better clustering result can be obtained by using the proposed method.

Key words: semi-supervised clustering；active learning；pairwise constraint；spectral clustering

0 引引引言言言

信息技术的迅猛发展极大地帮助人们提高了数

据收集、数据存储的能力, 在科学研究和社会生活的

各个方面都积累了海量的数据, 对这些数据进行分析

和发掘其中蕴含的有价值信息, 已经是各个领域的共

同需求. 以往的机器学习算法一般只考虑有标记数

据, 或者只考虑未标记数据, 但在现实环境中一般两

者兼有, 因此, 如何更有效地利用这些数据成为一个

亟待解决的问题. 近年发展起来的半监督学习是解决

这一问题的有效方法, 它通过广泛利用无标号数据样

本的先验知识来完成对样本数据的分类或聚类. 目

前, 应用样本的先验信息解决聚类问题已成为智能信

息处理的重要途径和研究热点

[1-6]

半监督聚类一般通过两种先验信息引导聚类过

程, 即标号点信息和成对约束信息. 由于标号点信息

可以转化为成对约束信息, 通常用成对约束信息作为

半监督聚类先验信息来监督聚类过程

[1]

. 作如下规定:

1) must-link, 若两样本为 must-link 约束, 则它们在聚

类时必须被分配到同一类中 (即 Must-link 约束要求

两个数据点必须在同一个聚类中); 2) cannot-link, 若

两样本是 cannot-link 约束, 则它们在聚类时必须被分

配到不同类中 (即 cannot-link 约束要求两个点不能在

收稿日期: 2012-02-22；修回日期: 2012-11-05.

基金项目: 国家自然科学基金项目(61074067, 21106036)；湖南省自然科学基金项目(10JJ5064, 11JJ6051)；教育部人文

社科研究一般规划基金项目(11YJAZH039)；湖南省重点学科建设项目.

作者简介: 蒋伟进(1964−), 男, 教授, 博士, 从事机器学习、智能计算等研究；许宇晖(1969−), 女, 讲师, 从事计算机控

制与应用的研究.

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余4页未读，立即下载

评论收藏

内容反馈

weixin_38694023

粉丝: 4
资源: 976

基于谱图和成对约束的主动半监督聚类算法

一种基于Seeds集和成对约束的半监督聚类算法 (2012年)

具有成对约束的半监督DenPeak聚类

一种新的约束谱聚类算法

半监督聚类中成对约束的主动学习 (2011年)

计算机研究 -基于标签传播的半监督聚类算法研究.pdf

机器学习 聚类算法

主动半监督仿射传播聚类算法

半监督聚类的样本约束

FDC-main.zip_matlab例程_matlab__matlab例程_matlab_

使用成对约束的稀疏表示的自适应半监督降维

成对约束对称非负矩阵分解的社区检测

Semi-Supervised Dimensionality Reduction

具有成对约束的图正则化非负局部坐标分解用于图像表示

Qt 5实现串口调试助手 （源工程文件、0积分下载）

【SystemVerilog】路科验证V2学习笔记（全600页）.pdf

AutoSAR标准协议4.2.2

光伏-储能并网系统仿真.rar

XCP协议的规范文档

GD32替换STM32注意事项.pdf

NPPJSONViewer.zip

最新资源

机器学习聚类算法

Qt 5实现串口调试助手（源工程文件、0积分下载）