没有合适的资源?快使用搜索试试~ 我知道了~
kaldi详细介绍资料
3星 · 超过75%的资源 需积分: 50 100 下载量 89 浏览量
2017-11-21
10:30:21
上传
评论 3
收藏 2.93MB PDF 举报
温馨提示
试读
154页
kaldi是一个当下流行的语音识别工具箱,此文档可以帮助你详细的了解kaldi以及入门kaldi。
资源推荐
资源详情
资源评论
kaldi
资料归纳和总结
wbglearn
(吴本谷)
version 0.7
2016
年
9
月
5
日
目录
目录......................................................................................................................................2
0 开篇前的话......................................................................................................................4
1 kaldi 的介绍......................................................................................................................5
1.1 kaldi 简介...............................................................................................................5
1.2 kaldi 的特色...........................................................................................................5
1.3 kaldi 的声学模型...................................................................................................5
1.4 kaldi 所用到的库介绍:..........................................................................................5
2 kaldi 的安装和出现错误的解决方案..............................................................................6
2.1 安装前的配置........................................................................................................6
2.2 安装........................................................................................................................6
2.2.1 Unbunt.........................................................................................................6
2.2.2 Cygwin........................................................................................................ 6
2.2.3 服务器或者工作站.....................................................................................7
3 kaldi 的使用......................................................................................................................8
3.1 总述........................................................................................................................8
3.2 kaldi 里各种数据库的介绍.................................................................................15
3.3 yesno 的例子....................................................................................................... 16
3.4 timit...................................................................................................................... 16
3.5 rm......................................................................................................................... 16
3.6 voxforge............................................................................................................... 17
3.7 kaldi 上使用 GPU 以及如何安装 cuda.............................................................. 17
3.8 可以使用的公开数据库......................................................................................19
3.9 如何使用自己的数据集......................................................................................19
3.10 kaldi 上第一个中文数据库...............................................................................20
3.11 对各位语音识别新手的建议............................................................................20
3.12 如何使用 kaldi 工具包使用小数字语料库创建一个简单的 ASR 系统........ 23
4 kaldi 主页上的翻译........................................................................................................34
4.1 数据准备..............................................................................................................35
4.2 特征提取..............................................................................................................51
4.3 声学建模代码......................................................................................................53
4.4 kaldi 里解码图的构建.........................................................................................55
4.5 Karel 的深度神经网络训练实现........................................................................59
4.6 Kaldi 中的关键词搜索........................................................................................63
4.8 在线识别..............................................................................................................75
4.9 决策树是如何在 kaldi 中使用............................................................................79
4.10 Decision tree internals........................................................................................88
4.11 HMM 拓扑结构和转移模型............................................................................92
4.12 kaldi 里的聚类机制.........................................................................................100
4.13 Decoding-graph creation recipe (training time)...............................................102
4.14 Decoding-graph creation recipe (test time)......................................................104
4.15 kaldi tutorial..................................................................................................... 112
5 附录..............................................................................................................................136
5.1 kaldi 上搭建 TIMIT 基线系统..........................................................................136
5.2 kaldi
里的
voxforge........................................................................................... 139
5.3
在
vs 2013
中编译
kaldi.................................................................................... 144
5.4 kaldi
学习联盟群第一次讨论记录
...................................................................145
6
其他资料和资源
..........................................................................................................153
7
版本更新日志
..............................................................................................................154
0
开篇前的话
首先,先打 2 个广告。希望大家看到文档的同时,可以积极参与讨论。
第一个广告:kaldi 学习 语音深度学习群,群号是:367623211。欢迎大家的
加入。
第二个广告:语音识别论坛,论坛地址:
http://www.threedweb.cn/forum-76-1.html 论坛欢迎大家的发帖和跟帖,欢迎大家
积极讨论。
其次,关注我博客(http://blog.csdn.net/wbgxx333)的人应该知道本文档是建
立在群里大家的共同努力完成的,特别是对 kaldi 主页翻译的部分,感谢每个参
与翻译的人,感谢你们的辛勤劳动和付出,希望可以对学习 kaldi 的人有用。
最后,希望大家可以积极参与讨论,让群和论坛全部活跃起来,也可以使语
音识别逐渐成为大家的生活的一部分。
备注:此文档不定期更新,如果您发现有任何问题和疑问,欢迎随时在群里
跟我联系或者通过邮箱(wbglearn@gmail.com 或者 354475072@qq.com)与我联
系,我们将逐渐完善该文档。
2014.8.16
最近都在对 kaldi 的脚本和源码有兴趣,欢迎大家积极交流。大家的看的时候
希望做下笔记,然后写下你自己的理解,希望你可以发给我,我将放在我们这里,
供大家学习,希望越多的人加入进来,为未来的人铺好路。此外,大家在学习
kaldi 的过程一定要注重对代码和脚本的学习,学的深一点,不要仅仅会运行。
祝大家学习愉快!
2016.9.8
Kaldi 新手群:279295537。欢迎各位新手加入。Kaldi 学习群现在人员满了,
需要回答问题才能入群。
1 kaldi
的介绍
1.1 kaldi 简介
kaldi是一个开源的语音识别工具箱,是基于c++编写的,可以在windows和unix
平台上编译。
1.2 kaldi 的特色
与文本无关的LVCSR系统;
基于FST的训练和解码;
最大似然训练;
各种各样的线性和映射变换;
有VTLN,SAT的脚本;
1.3 kaldi
的声学模型
支持标准的机器学习训练模型:
线性变换如:
LDA HLDA,MLLT/STC
;
说话人自适应
:fMLLR,MLLR
;
支持
GMM,SGMMs,DNN
1.4 kaldi 所用到的库介绍:
1.OpenFst:Weighted Finite State Transducer library (加权有限状态转换器)
2.ATLAS/CLAPACK:标准的线性代数库
3.sph2pipe:由 sph 文件转成其他音频文件
4.srilm:语言模型的工具箱
5.sctk:score benchmark(评价 ASR 基准)
剩余153页未读,继续阅读
资源评论
- Y8118697792018-08-29比较简答,适合入门
农村詹姆斯
- 粉丝: 419
- 资源: 5
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功