没有合适的资源?快使用搜索试试~ 我知道了~
计算机研究 -基于流形学习的数据聚类与可视化.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 28 浏览量
2022-06-28
04:11:16
上传
评论
收藏 1.16MB PDF 举报
温馨提示
试读
67页
计算机研究 -基于流形学习的数据聚类与可视化.pdf
资源推荐
资源详情
资源评论
摘 要
随着数据采集技术、通信技术和网络技术的迅速发展,人们在实际获取的数
据维数越来越高,如何有效的描述高维数据,实现数据分析,如聚类已成为一个
热点研究方向。论文借助流形学习的思想对数据进行约简处理,将高维数据映射
到维结构空间,然后在低维空间实现数据聚类。论文的主要内容和创新如下:
1.针对 LPP 算法不能有效的保留数据间的多样性信息,受启发于 PCA 和流
形学习,利用邻接图描述数据的内在几何结构,较好的刻画了数据的相似几何属
性和多样性几何属性,给出了分别度量相似性和多样性的离散度矩阵,提出了一
种基于最小化相似离散度和最大化多样性离散度的准则的聚类算法(Local
Similarity and Diversity Preserving Projection Clustering, LSDPC),该算法首先对数
据进行降维,然后在投影空间中,使用 k-means 算法对数据聚类,和传统的聚类
算法相比,LSDPC 克服了数据维数的影响,且能够得到能有效的代表高维数据的
低维表示,实验验证了该算法的有效性。
2.基于半监督的聚类算法只适合于低维数据,导致实际效果不好,提出一
种 基 于 判 别 分 析 的 半 监 督 聚 类 算 法 ( Local Discriminant Embedding
Semi-supervision Clustering)LDESC 来解决高维数据的聚类问题。该算法首先构
造两个邻接图,同类局部邻接图和不同类类间邻接图,其中同类局部邻接图主要
包括描述同类局部相似几何信息和同类局部多样性几何属性的邻接图,然后给出
了分别度量同类局部信息和不同类判别信息的离散度矩阵,最后建立一个特征提
取准则,实验验证了所提供算法的有效性。
关键词: 聚类 流形学习 半监督聚类 判别分析
Abstract
With the rapid development of data collection, communication technology and
network technology, dimensionality of natural data becomes higher and higher, thus
how to represent data effectively so as to facilitate subsequent processing, such as
cluster analysis has become a hot research direction. This dissertation mainly studies
the data feature extraction methods based on manifold, mapping the original data to the
low structure space, and then facilitating the data clustering in the low dimensional
space. The main contents and contributions are as follows:
1. Inspired by LPP and PCA, the combined Local Similarity and Local Diversity
based on the manifold learning clustering algorithm (LSDPC) is proposed.
LSDPC defines adjacency graphs to characterize the geometry of data, which reflects
the similarity of data; and variability of data. And then, similarity scatter, diversity
scatter are calculated from the corresponding graphs respectively. At last, A feature
extraction criterion is raised by minimizing the scatter, which efficiently preserves the
locality, and simultaneously maximizing the variation of data. Compared with the
traditional clustering methods, LSDPC overcomes the influence of the data dimension
and get the effective represent high dimension data of the low dimensional, the
experiments show the effectiveness of the proposed algorithm.
2. Most existing semi-supervised clustering algorithm only are suitable for the
low dimensional data., a semi-supervised clustering based on the discirminant analysis
(LDESC) is proposed to deal with the high-dimensional data. The algorithm LDESC
defines two adjacency graphs, one adjacency graph and margin graph, one adjacency
graph, which includes similarity and variation of the data points belonging to the same
class. And then, adjacency scatter, diversity scatter are calculated from the
corresponding graphs respectively. At last, A feature extraction criterion is raised,
which can get the best projection directions. The experiments show the effectiveness of
the proposed algorithm.
Keywords : Clustering Manifold learning Semi-supervised clustering
Discirminant analysis
剩余66页未读,继续阅读
资源评论
programyp
- 粉丝: 86
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- XILINXFPGA源码Xilinxspratan3xcs100E(VGAPS2)
- XILINXFPGA源码XilinxSPARTAN-3E入门开发板实例
- XILINXFPGA源码XilinxSdramVerilog和VHDL版本文档
- 物联网智能家居方案-基于Nucleo-STM32L073&机智云(大赛作品,文档齐全,可直接运行)(文档加Matlab源码)
- XILINXFPGA源码XilinxISE9.xFPGACPLD设计源码
- 成都市地图含高新区(高新南区,高新西区),天府新区,东部新区虚拟行政区划
- XILINXFPGA源码XilinxEDK设计试验
- XILINXFPGA源码XilinxEDKMicroBlaze内置USB固件程序
- 基于 django 的视频点播后台管理系统源代码+数据库
- 基于Java的网上医院预约挂号系统的设计与实现(部署视频)-kaic.mp4
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功