没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐
PocketSphinx 语音识别系统语言模型的训练和声学模型的改进
是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。 从开
发之初就得到了 、 等多个部门的资助和支持,后来逐步发展为开源项目。目前
小组开发的下列译码器。
是由 语言编写的大词汇量语音识别系统,采用连续的隐含马尔可夫模型建模,和以前
的版本相比,它在模块化、灵活性和算法方面做了改进,采用新的搜索策略,支持各种不同的语法和语
言模型、听觉模型和特征流,创新的算法允许多种信息源合并成一种更符合实际语义的优雅的知识规则。
由于完全采用 语言开发,具有高度的可移植性,允许多线程技术和高度灵活的多线程接口。
上 环境的搭建可以参照: !"#$%& %'$(')。特
别需要注意的是新的版本已经没有自带的中文模型,需要的话要到
&*&&+,*下载
1:训练语言模型:
需要文件:写有包含中文内容的语料库 ,网上工具:---, ,
-,,上传中文内容的语料库 的文件,就可以返回语言模型文件。如果你的语言模型比较大的话,
最好就转换为 的二进制格式 ./,这样可以加快加载语言模型的速度,减少解码器初始化的时
间。但对于小模型来说,就没有这个必要。面令
01,12&要转换的模型 输出的模型
2.声学模型改进:
需要的文件: 记录音频文件的地址,如(下面例子表明音频文件是当目录下的 ##33#314~
##33#514):
&:中文句子与语音文件的对应,如:
67中关村67.##33#314/
67北京人67.##33#(14/
67生活67.##33#814/
67朋友67.##33#14/
67熬夜67.##33#514/
! 字典文件9可以由原有模型得到,也可以自己新建,如:
中关村 !%
##33#314
##33#(14
##33#814
##33#14
##33#514
林书尼
- 粉丝: 20
- 资源: 315
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于c++的个人收支管理系统设计
- docker一键安装包
- Screenshot_20240430_144340_com.ss.android.ugc.live.jpg
- 回到山沟沟.mp3
- 基于matlab实现自适应波束形成RLS及LMS算法仿真源程序1.rar
- 基于matlab实现自己编写的基于卡尔曼滤波的利用加速度传感器的计步器,测试数据是传感器放在腰部和手臂 .rar
- 基于matlab实现阵列信号处理,波束形成.rar
- 111111111111111111
- 基于matlab实现计步器编程;对当前的计步器装置的数值算法模拟 .rar
- Mdb学习查看PW;access;mdb;pw;password;patch
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0