聚类是一种包括数据点分组的机器学习技术。
聚类是一种无监督学习的方法,是一种在许多领域常用的统计数据分析技术
给定一组数据点,我们可以用聚类算法将每个数据点分到特定的组中。 理论上,属于
同一组的数据点应该有相似的属性或特征,而属于不同组的数据点应该有非常不同的属性
或特征。
聚类算法有很多种,比如层次聚类,划分聚类,密度聚类等等。
K-Means聚类是可能是我们最熟知的聚类算法之一。它在很多介绍性的数据科学和机
器学习课程中出现过。因为很容易理解并且容易用代码实现,所以在这里我们首先对该算
法进行学习。
1.2 什么是聚类
QQ:1366420642
05