合著者:Vincent De Sapio 和 Philip Kegelmeyer
这是一个 Matlab 工具箱,用于研究聚类集成在数据分类中的应用,目的是提高聚类的准确性和/或速度。 该工具箱将集群集成问题分为四个区域,为每个区域提供功能。 这些包括,(1) 合成数据生成,(2) 聚类以生成单个数据分区和相似性矩阵,(3) 共识函数生成和最终聚类以生成集成数据分区,以及 (4) 准确性指标的实现。
在数据生成方面,可以生成任意维度的高斯数据。 然后,kcenters 算法可用于通过 (a) 对数据进行子采样并对每个子样本进行聚类,或通过 (b) 随机初始化算法并为每次初始化生成聚类来生成单个数据分区。 在任何一种情况下,都可以使用对单个相似性矩阵进行操作的一致函数来计算整体相似性矩阵。 可以执行最终聚类,并提供性能指标用于评估目的。
评论0
最新资源