1
1 概述 ............................................................................................................................................... 1
2 简单说话人识别流程 .................................................................................................................... 1
2.1 特征提取............................................................................................................................. 2
2.2 训练说话人模型 ................................................................................................................. 2
2.3 模式匹配与判决决策 ......................................................................................................... 2
3 特征提取....................................................................................................................................... 2
3.1 预加重................................................................................................................................ 3
3.2 分帧 ................................................................................................................................... 4
3.3 加窗 ................................................................................................................................... 4
延伸阅读 ................................................................................................................... 6
3.4 提取 MFCC ......................................................................................................................... 6
3.4.1 短时傅里叶变换 FFT .............................................................................................. 6
延伸阅读 ................................................................................................................... 7
3.4.2 频谱图..................................................................................................................... 7
3.4.3 倒谱分析 ................................................................................................................. 8
延伸阅读 ................................................................................................................... 9
3.4.4 差分......................................................................................................................... 9
4 基于 GMM-UBM 的说话人识别基准模型 ................................................................................. 10
4.1 混合高斯模型 GMM(Gaussian Mixture Model) ............................................................. 10
4.1.1 高斯模型 GM ........................................................................................................ 10
4.1.2 混合模型 MM ....................................................................................................... 11
延伸阅读 ................................................................................................................. 12
4.1.3 高斯混合模型 GMM ............................................................................................ 12
4.1.3.1 为什么要用 GMM? .................................................................................. 12
4.1.3.2 GMM 定义 .................................................................................................. 13
延伸阅读: ................................................................................................................ 13
4.1.4 模型训练 ............................................................................................................... 13
4.1.4.1 最大似然估计(MLE): 优化目标 ............................................................... 13
4.1.4.2 期望最大化算法(EM): 优化方法 .............................................................. 15
从实现算法的角度直观理解 GMM 中的 EM 算法 ...................................... 15
从数学原理理解 GMM 中的 EM 算法 .......................................................... 17
从更抽象的角度理解通俗的 EM 算法 .......................................................... 20
总结 ................................................................................................................. 21
延伸阅读: ................................................................................................................ 21
4.2 通用背景模型 UBM(universal background model) ........................................................ 22
4.3 GMM-UBM 模型 ............................................................................................................... 22
获取”原始基因”: ............................................................................................................ 23
“基因突变”: .................................................................................................................... 23
总结 ................................................................................................................................. 24
延伸阅读 ......................................................................................................................... 24
5 未知语音评判打分 ..................................................................................................................... 24
6 评测声纹识别系统性能 ............................................................................................................. 25
6.1 基本技术指标 .......................................................................................................... 25
6.2 性能指标 .................................................................................................................. 26
评论0
最新资源