K-means算法及最佳聚类数目的确定,通过计算原始数据中的:CH值、DB值、Gap值、轮廓系数,四种指标。
1.在Kmeans算法中,K值所决定的是在该聚类算法中,所要分配聚类的簇的多少。Kmeans算法对初始值是⽐较敏感的,对于同样的k值,选取的点不同,会影响算法的聚类效果和迭代的次数。通过计算原始数据中的:CH值、DB值、Gap值、轮廓系数,四种指标来衡量K-means的最佳聚类数目,并使用K-means进行聚类,最后可视化聚类的结果。
2.直接替换Excel数据即可用,注释清晰适合新手小白,聚类结果存放在kind变量中,附赠示例数据,如图2所示,直接运行main一键出图。