黎郡 2020E8017782051
Assignment-5
Question
关于谱聚类。有如下 200 个数据点,它们是通过两个半月形分布生成的。如图所示:
请编写一个谱聚类算法,实现"Normalized Spectral Clustering—Algorithm 3 (Ng 算法)".
设点对亲和性(即边权值)采用如下计算公式:
数据图采用 k-近邻方法来生成(即对每个数据点 ,首先在所有样本中找出不包含 的 k 个最邻近的样
本点,然后 与每个邻近样本点均有一条边相连,从而完成图构造)。
注意,为了保证亲和度矩阵 W 是对称矩阵,可以令 . 假设已知前 100 个点 为一个聚类, 后
100 个点为一个聚类,请分析分别取不同的 值和 k 值对聚类结果的影响。 (本题可以给出关于聚类精
度随着 值和 k 值的变化曲线。在实验中,可以固定一个,变化另一个).
附注 :聚类精度 Accu 计算如下:
其中, 表示正确的属于第一个聚类的样本点的个数; 表示正确的属于第二个聚类 的样本点
的个数;n 表示样本点的总数。
评论0