【免费】PocketSphinx语音识别系统语言模型的训练和声学模型的改进1_语音识别模型资源-CSDN文库

需积分: 0 32 浏览量 2022-08-03 23:51:12 上传评论收藏 589KB PDF 举报

资源详情

资源评论

资源推荐

PocketSphinx 语音识别系统语言模型的训练和声学模型的改进

 是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。 从开

发之初就得到了 、 等多个部门的资助和支持，后来逐步发展为开源项目。目前 

小组开发的下列译码器。

 是由  语言编写的大词汇量语音识别系统，采用连续的隐含马尔可夫模型建模，和以前

的版本相比，它在模块化、灵活性和算法方面做了改进，采用新的搜索策略，支持各种不同的语法和语

言模型、听觉模型和特征流，创新的算法允许多种信息源合并成一种更符合实际语义的优雅的知识规则。

由于完全采用  语言开发，具有高度的可移植性，允许多线程技术和高度灵活的多线程接口。

上  环境的搭建可以参照： !"#$%& %'$(')。特

别需要注意的是新的版本已经没有自带的中文模型，需要的话要到

&*&&+,*下载

1：训练语言模型：

需要文件：写有包含中文内容的语料库，网上工具：---, ,

-,，上传中文内容的语料库的文件，就可以返回语言模型文件。如果你的语言模型比较大的话，

最好就转换为  的二进制格式 ./，这样可以加快加载语言模型的速度，减少解码器初始化的时

间。但对于小模型来说，就没有这个必要。面令

01,12&要转换的模型  输出的模型

2.声学模型改进：

需要的文件： 记录音频文件的地址，如（下面例子表明音频文件是当目录下的 ##33#314～

##33#514）：

&：中文句子与语音文件的对应，如：

67中关村67.##33#314/

67北京人67.##33#(14/

67生活67.##33#814/

67朋友67.##33#14/

67熬夜67.##33#514/

! 字典文件9可以由原有模型得到，也可以自己新建，如：

中关村 !%

##33#314

##33#(14

##33#814

##33#14

##33#514

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余3页未读，立即下载

评论0

内容反馈

林书尼

粉丝: 20
资源: 315

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip