1
统计自然语言处理基础
第 14 章 聚类
王建华
2007-09-07
2
提纲
聚类概述
用途
种类
“ 软”聚类 ,” 硬”聚类
层级聚类
单连通、全连通
平均连通
自顶向下聚类
非层级聚类
K 平均算法
EM 算法
3
提纲
聚类概述
用途
种类
“ 软”聚类 ,” 硬”聚类
层级聚类
单连通、全连通
平均连通
自顶向下聚类
非层级聚类
K 平均算法
EM 算法
4
聚类概述
聚类算法的目标:
是将一组对象划分成若干组或类别,简单地说
就是相似元素同组、相异元素不同组的划分过
程。
定义:
聚类是一个无指导的学习过程,它是指根据样
本之间的某种距离在无监督条件下的聚簇过程。
5