具体分为:凝聚法和分裂法
凝聚法:指起初每个对象被认为是一个簇,然后不断合并相似的簇,直到达到
一个令人满意的终止条件;
分裂法:先把所有的数据归于一个簇,然后不断分裂彼此相似度最小的数据
集,使簇被分裂成更小的簇,直到达到一个令人满意的终止条件。
根据簇间距离度量方法的不同,层次法可分为不同的种类。常用的距离度量方法包
括:最小距离、最大距离、平均值距离和平均距离等。
典型算法:CURE、Chameleon和BIRCH等
基于密度的聚类
这类算法的思想是:只要某簇邻近区域的密度超过设定的某一阈值,则扩大簇的范
围,继续聚类。
这类算法可以获得任意形状的簇。
典型算法:DBSCAN、OPTICS和DENCLUE等。
缺点:(对参数的取值敏感,R的取值需要合适)
基于网格的聚类
基于网格的聚类算法首先将问题空间量化为有限数目的单元,形成一个空间网格结
构,随后聚类在这些网格之间进行。
这类算法速度较快。
典型算法:STING、WaveCluster和CLIQUE等。
缺点:参数敏感、一般情况下只在低维空间有效(格子数量随维度指数级增长)
聚类分析的典型应用?
作为获得数据集中数据分布的工具