没有合适的资源?快使用搜索试试~ 我知道了~
计算机研究 -基于标签传播的半监督聚类算法研究.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 25 浏览量
2022-06-26
13:29:24
上传
评论
收藏 2.17MB PDF 举报
温馨提示
试读
63页
计算机研究 -基于标签传播的半监督聚类算法研究.pdf
资源推荐
资源详情
资源评论
目 录
中 文 摘 要 ................................................................................................................... I
ABSTRACT ........................................................................................................................III
第一章 绪论 .........................................................................................................................1
1.1 研究背景及意义 ....................................................................................................1
1.2 半监督聚类算法研究现状 ....................................................................................1
1.3 半监督聚类所面临的一些问题 ............................................................................3
1.4 论文的研究内容与组织架构 ................................................................................3
第二章 基于成对约束的标签传播算法 .............................................................................5
2.1 引言 ........................................................................................................................5
2.2 经典的标签传播算法 ............................................................................................5
2.3 基于成对约束的标签传播算法 ............................................................................7
2.4 实验分析 ................................................................................................................9
2.4.1 实验设置 .....................................................................................................9
2.4.2 实验结果 ................................................................................................... 11
2.5 本章小结 ..............................................................................................................20
第三章 基于安全性的成对约束扩充算法 .......................................................................21
3.1 引言 ......................................................................................................................21
3.2 成对约束的传递性 ..............................................................................................21
3.3 基于安全性的成对约束扩充算法 ......................................................................23
3.4 实验分析 ..............................................................................................................25
3.5 本章小结 ..............................................................................................................28
第四章 半监督聚类分析系统的设计与实现 ...................................................................31
4.1 系统功能 ..............................................................................................................31
4.2 系统功能界面展示 ..............................................................................................31
4.2.1 初始化模块 ...............................................................................................31
4.2.2 算法模块 ...................................................................................................33
4.2.3 结果展示模块 ...........................................................................................33
4.3 本章小结 ..............................................................................................................39
第五章 总结与展望 ...........................................................................................................41
万方数据
5.1 总结 .......................................................................................................................41
5.2 展望 .......................................................................................................................41
参考文献 .............................................................................................................................43
攻读学位期间取得的研究成果 .........................................................................................49
致谢 .....................................................................................................................................51
个人简况及联系方式 .........................................................................................................53
承诺书 .................................................................................................................................55
学位论文使用授权说明 .....................................................................................................57
万方数据
Contents
Chinese Abstract .................................................................................................................. I
ABSTRACT .......................................................................................................................III
Chapter 1 Introduction .......................................................................................................1
1.1 Research background and significance ...................................................................1
1.2 The current research status of semi-supervised clustering ......................................1
1.3 Some issues of semi-supervised clustering .............................................................3
1.4 The content and organizational structure of the thesis ............................................3
Chapter 2 The label propagation algorithm with pairwise constraints .........................5
2.1 Introduction .............................................................................................................5
2.2 The classical label propagation algorithm ...............................................................5
2.3 The label propagation algorithm with pairwise constraints ....................................7
2.4 Experimental analysis ..............................................................................................9
2.4.1 Experimental setup .......................................................................................9
2.4.2 Experiment results ...................................................................................... 11
2.5 Conclusion .............................................................................................................20
Chapter 3 The extended algorithm of pairwise constraints based on security ............21
3.1 Introduction ...........................................................................................................21
3.2 The transitivity property of pairwise constraints ...................................................21
3.3 The extended algorithm of pairwise constraints based on security .......................23
3.4 Experimental analysis ............................................................................................25
3.5 Conclusion .............................................................................................................28
Chapter 4 Design and implementation of the system .....................................................31
4.1 System function .....................................................................................................31
4.2 The display of system function ..............................................................................31
4.2.1 The initialization module of the system .....................................................31
4.2.2 The algorithm module of the system ..........................................................33
4.2.3 The result display module of the system ..................................................33
4.3 Conclusion .............................................................................................................39
Chapter 5 Conclusion and expectation ............................................................................41
万方数据
5.1 Conclusion .............................................................................................................41
5.2 Expectation ............................................................................................................41
References ..........................................................................................................................43
Research achievements .....................................................................................................49
Acknowledgment ...............................................................................................................51
Personal profiles ................................................................................................................53
Letter of commitment ........................................................................................................55
Authorization statement ...................................................................................................57
万方数据
I
中 文 摘 要
聚类分析是数据挖掘中的一项重要技术,已被用来探索实际应用中各种数据的
潜在类结构。由于数据的复杂性,聚类结果并不一定能满足用户期望。半监督聚类利
用少量的先验信息指导聚类过程,使得聚类结果尽可能的满足用户期望。本文以如何
利用和传播先验信息为主题,针对标签传播算法和成对约束的扩充算法进行了系统
的研究,主要研究内容如下:
(1)本文对标签传播算法进行了扩展,提出了基于成对约束的标签传播算法。
在该算法中,我们将先验信息保存到成对关系矩阵中,并且通过计算成对关系与聚类
结果之间的差异来代替划分矩阵之间的差异。同时,我们通过构建一种新的最优化模
型,将标签传播算法的最优化问题转化为谱聚类问题,并通过特征值分解方法得到最
优解。该算法不仅可以解决标签传播过程中存在的非对齐问题,同时还可以处理成对
约束先验信息。最后,将该算法与 8 种半监督聚类算法在 11 个基准数据集上进行了
比较。实验结果表明,所提出的算法相比其他算法更有效。
(2)成对约束的数量是影响半监督聚类结果有效性的重要因素。然而,在现实
应用中,成对约束的获取需要耗费大量的成本。因此,本文提出了一种基于安全性的
成对约束扩充方法。该算法通过统计传递闭包中最大局部连通距离作为安全值,并且
根据安全值来修改传递闭包之间的相似性,减少合并传递闭包带来的风险。最后利用
模块度算法合并相似的传递闭包达到扩充成对约束的目的。我们在 8 个基准数据集
上进行了成对约束扩充算法的比较。实验结果表明,所提出的算法可以安全有效的扩
充成对约束。
(3)设计并开发了一个半监督聚类分析系统,该系统包括数据导入,算法选择,
结果展示等功能。系统集成了本文所使用的半监督聚类算法,可以对不同的数据集和
先验信息进行测试,具有较好的可用性。
本文的研究成果进一步丰富了半监督聚类方面的研究,为标签传播提供了有效
的技术支持。
关键词: 聚类分析;半监督聚类;标签传播;成对约束;谱聚类
万方数据
剩余62页未读,继续阅读
资源评论
programyp
- 粉丝: 86
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功