姓名:张志超
学号:P1120606
电话:18810261162
E-mail:beyond9017@163.com
======================================================================
实验七 LBG 分类算法
1. 实验目的
矢量量化:将某一范围内的矢量归为某一类,包含两个步骤:
先要生成码本,这是将语音的特征矢量空间首先进行划分的过程--也称为聚类;
将语音参数序列作为矢量,参照码本进行归类的过程--也称为量化。
聚类算法:比较简单常用的是 K 均值聚类算法。LBG 是一种聚类算法,该算法一般假
定码本大小固定,而且为 2 的幂。码本开始很小,然后不断扩大,直到达到要求。它常把一
个已存在的分类分裂成两个小类,并给每个小类以新的码字初值。
用 LBG 算法对随机数据和有一定规律(符合一定高斯分布)的数据进行分类,看看 LBG
算法的性能
用初始室心随机法和扰动因子分裂法两种方法,比较不同方法不同参数设置时的分类性
能。
2. 实验内容
1) 初始化所有参数。
2) 需要的分类数/最大叠代次数/最小畸变改进量
3) 确定(更新)室心。确定初始室心时可以使用随机法或扰动因子分裂法,LBG 算法使
用扰动因子法将整个训练集作为一个初始类。初始码本只有一个码字,即整个训练
集的质心。然后将该类分裂为两个子类,结果码本大小增大一倍,
4) K 均值聚类。
5) 重复这种“聚类—分裂”过程,直到码本大小达到要求
3. 实验分析
实验的样本采用高斯分布随机出来的数据,如图 1 所示,样本是均值为 0,标准差为 1
的二维正太分布。
实验第二步要确定室心,确定初始室心时可以使用初始室心随机法或扰动因子分裂法。
其中随机法不需要初始化,从训练矢量集中随机地取出 N 帧矢量作为 N 个初始中心。这种
方法带有一定的“盲目性”。 初始室心随机法的结果如图 2 所示。
评论0