1
概述 ....................................................................................................................................... 4
1.1
语音识别
........................................................................................................................................ 4
1.2
语音识别的分类方法
.................................................................................................................... 4
1.2.1 按词汇量大小分 ......................................................................................................................... 4
1.2.2 按发音方式分 ............................................................................................................................. 5
1.2.3 按说话人分 ................................................................................................................................. 5
1.2.4 从语音识别的方法分 ................................................................................................................. 5
1.3
语音识别的主要方法
.................................................................................................................... 5
1.4
学习资源
........................................................................................................................................ 6
2
HMM 与语音识别 ................................................................................................................. 8
2.1
马尔可夫链
.................................................................................................................................... 8
2.2
隐马尔可夫模型(
HMM
)
........................................................................................................... 9
2.2.1 一个具体例子 ........................................................................................................................... 10
2.2.2 三个基本问题 ........................................................................................................................... 12
2.3
离散、连续和半连续的
HMM .................................................................................................... 16
2.3.1 离散 HMM ................................................................................................................................. 16
2.3.2 连续 HMM ................................................................................................................................. 16
2.3.3 半连续 HMM ............................................................................................................................. 17
2.4 HMM
实现、训练中的问题
........................................................................................................ 18
2.4.1 拓扑结构 ................................................................................................................................... 18
2.4.2 初始模型选取 ........................................................................................................................... 18
2.4.3 数据下溢问题 ........................................................................................................................... 19
2.4.4 训练数据的不足 ....................................................................................................................... 19
2.4.5 处理说话人的影响 ................................................................................................................... 19
3
语音识别系统 ...................................................................................................................... 21
3.1
一般过程
...................................................................................................................................... 21
3.2
基于
HMM
的基本架构
............................................................................................................... 22
3.3
信号处理、特征分析
.................................................................................................................. 22
3.3.1 数字化 ....................................................................................................................................... 23
3.3.2 时域分析 ................................................................................................................................... 24
3.3.3 频域分析 ................................................................................................................................... 25
3.4
特征提取
...................................................................................................................................... 25
3.4.1 线性预测系数(LPC) ............................................................................................................. 25
3.4.2 倒谱系数 ................................................................................................................................... 25
3.4.3 梅尔频率倒谱系数(MFCC) .................................................................................................. 26
3.4.4 感知线性预测(PLP) ............................................................................................................. 26
3.5
矢量量化
...................................................................................................................................... 26