01
前言
作为无监督聚类算法中的代表——K均值聚类算法,该算法的主要作用是将相似的样本
自动归到一个类别中。所谓的监督算法,就是输入样本没有对应的输出或标签。聚类
试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”,
聚类既能作为一个单独过程,用于找寻数据内在的分布结构,也可作为分类等其他学
习任务的前去过程。聚类算法也许是机器学习中“新算法”出现最多、最快的领域,一
个重要的原因是聚类不存在客观标准,给定数据集总能从某个角度找到以往算法未覆
盖的某种标准从而设计出新算法。K-means算法十分简单易懂而且非常有效,但是合
理的确定K值和K个初始类簇中心点对于聚类效果的好坏有很大的影响。
评论0
最新资源