基于卷积神经网络的苗语孤立词语音识别.docx资源-CSDN文库

版权申诉

文档资料

26 浏览量 2022-06-24 13:37:33 上传评论收藏 362KB DOCX 举报

资源详情

资源评论

引言

语音识别技术在汉语、英语和一些常用少数民族语言（藏语、蒙语、维尔吾语）中已有一定研究基础



，但关于低资源、无文字的少数民族语言（苗语、普米语、佤语、白语）的语音识别研究成果较少



。在历史上，苗语只有语言，没有通用文字



，其语言和文化仅通过口授相传，相关文字资料留存

有限，且受其他常用语言的影响，使用苗语交流的人越来越少，导致苗族的语言文化正逐渐走向消亡。

为了更好地传承和保护苗族语言文化，苗语语音语料库的构建和语音识别逐渐成为相关学者的研究重

点。

相关研究

早期语音识别方法主要基于动态时间规整算法（，）和隐马尔可夫模

型（，）实现。例如，徐利军

 

采用  算法和放宽起始点的 

算法对孤立词语音识别进行研究，发现相较于原始  算法，放宽起始点的  算法能有效降低

噪声干扰，但语音识别率改善不明显；易雪蓉等

!

利用  模型对声调语音模型进行研究，通过改

造语音模型和语言模型提高近音字和同音字的识别率，但对轻声和四声词识别效果不理想。

传统模型在小词汇识别方面取得了良好效果，但针对大量词汇、非特定人语音的识别效果有待提升。

近年来，深度学习技术在语音识别方面受到广大研究者的青睐。例如，"# 等

$

将前馈神

经网络（%%&'#'(&，%''）和递归神经网络（)#*'#

'(&，)''）引入声学模型中，在法语语音识别任务中， )'' 的效果优于 %''，但需进一步

改进最佳列表的解码；' 等



以深度神经网络—隐马尔科夫混合模型（''）为网络框架，

设计了一种自动噪声检测前端技术对孤立词进行识别，其在高噪声条件下的识别率高于梅尔频率倒谱

系数（%+#,*(,- (，%,,）；李云红等



提出一种结合深度玻尔兹曼

机（.(/0，.）的 '' 语音识别方法，在词错率和句错率方面比

传统 '' 模型均有所下降； 1*0 等



将卷积神经网络（ ,#(  '#

'(&*，,''）与 %,, 特征相结合，其对存在背景噪音的说话人识别精度达 ! 23，但该方

法的计算复杂度较高；"0(( 等



将 *4 框架引入语音识别系统中，其对低资源语言识别

任务的识别效果优于 )'' 模型；5 等

6

改进了语音识别系统中的 )'' 模型，相较于类似尺寸的混

合模型，该模型能有效降低识别错误率。

在少数民族语言语音识别研究中，韩清华等

 

采用  模型对安多藏语非特定人孤立词语音识别进

行了研究，但仅针对小量词汇进行了识别，且识别效果有待提高； 7 等



提出一种基于动态贝叶斯

网络（.*'(&，.'）的算法对藏语语音进行识别，相较于传统的  识

别算法，该算法提高了抗噪声的识别能力，但需要设计适合大量词汇和连续语音识别的 .' 识别模

型；5 等

 

对基于机器学习的孤立词识别算法进行研究，通过提取不同特征向量，在不同分类器下提

高了词语音识别的准确性；# 等

!

利用混合单元进行语言建模，通过引入插值 5 提高模型的识别

性能，降低对维吾尔族语言语音识别的错词率。目前，关于苗语数据收集、发音特点等已有一定研究，

但在语音识别方面研究成果较为欠缺。例如，李一如

$

对黔东苗语的比较结构进行了分析；李学林等



对贵州省中部苗语音素边界检测方法进行了研究，实现了音素边界的划分，但需要对音素进行人工

标注；杨建菊等



基于  对苗语连续语音识别系统进行初步设计和识别测试，但语音识别系统规

模较小、复杂度较低。

由于苗语存在文字缺失、地域差异等问题，采用现有语音识别方法难以直接对其进行识别。为此，本

文以汉语拼音为媒介标注苗语语音，构建包含常用字词句的苗语语音语料库，引入 ,'' 建立苗语孤

立词汇识别模型；然后以自建苗语语音语料库的数据作为实验数据集验证该模型对同地域和不同地域

苗语孤立词语音识别的有效性，检验具有地域差异的苗语孤立词语音对模型识别效果的影响。

语音语料库构建

语音语料库是语音识别研究的基础。苗语文本语料库需要借助汉字拼音或国际音标进行语音标注。苗

语虽然没有通用文字，但多数语法结构与汉语相似。因此，苗语语料库的构建需要参考汉语、英语及

其他少数民族语言语料库的构建方法



，语料选取要尽可能覆盖苗语语言内容，根据苗语的发音特点

及语法结构构建相对完备的苗语语音语料库，为苗语语音识别研究提供数据基础。

2苗语声韵母、声调特点

贵州中部苗语是基于声韵母、声调组合发音，本文参考贵州大学出版社出版的《苗族语文读本》



中

所列苗语声韵母及声调标注方法对苗语语料库进行标注，苗语声母、韵母、声调如表  所示。

Table 1Initial consonants，vowels and tone of Hmong language

表 1苗语声母、韵母、声调

声母韵母声调

89990949049&9 9999#99

(99099099/9 999999

*90*99:9+9;90;9 #999999 89;999(9*994

99990909090 #9#9#9#9# 

下载<导出

,"=

2苗语语料库构建

本文建立的苗语语音语料库主要参考小学语文课本、贵州普通话考试测试题以及《苗族语文读本》



内容进行录制采集，语料应充分展示中部苗语声母、韵母、声调的特点。选取具有代表性的字词句进

行录制，语料库包含苗语的  个常用字、! 个常用词和  个常用语句。采用单声道麦克风在

安静环境下进行语音录制，采样频率为 66/，保存格式为 1=。语料库构建包含苗语语音资

源采集、语音数据预处理、语音标注和存储 6 个步骤，具体如图  所示。

Fig. 1Construction ow of Hmong language corpus

图 1苗语语料库构建流程

下载<原图 >高精图 >低精图

苗语孤立词识别模型

首先提取苗语语音的 %,,，以 %,, 特征作为语音识别网络的输入训练模型，并采用测试数据对模

型进行测试。苗语孤立词的识别流程如图  所示。

剩余11页未读，继续阅读

评论收藏

内容反馈

版权申诉

基于卷积神经网络的苗语孤立词语音识别.docx

评论0

最新资源

基于卷积神经网络的苗语孤立词语音识别.docx

评论0

最新资源

相关推荐

基于卷积神经网络的孤立词语音识别.pdf

基于一维卷积神经网络和i-vector的孤立词语音识别.pdf

基于GMM的孤立词语音识别

基于STM32的孤立词语音识别

ImTranslator: 翻译，字典，声音-crx插件

中国语言地图集图片压缩包

互联网程序员都每天刷题嘛-Degoogle-your-life.github.io:去谷歌搜索你的生活的网站

RSVIEW 操作手册中文版压缩01

基于DTW算法的孤立词语音识别

基于DTW的孤立词语音识别代码

基于bp神经网络的孤立词识别.rar_TLF_matlab 孤立词_matlab 语音识别_神经网络语音

基于STM32的孤立词语音识别_单片机_语音识别_

RSVIEW 操作手册中文版压缩03

RSVIEW 操作手册中文版压缩02

基于矢量量化的0-9孤立词语音识别

基于Python实现孤立词语音识别【100010572】

基于MATLAB的孤立词语音识别系统分析.pdf

10.2 基于隐马尔可夫模型（HMM）的孤立字语音识别_隐马尔可夫模型（HMM）的孤立字语音识别_

基于matlab-dtw的孤立语音识别.zip

基于STM32的孤立词语音识别.zip

全国计算机等级考试二级Python真题及解析.docx

1000份ppt模版，PPT模板优秀PPT

matlab批量读取excel表格数据并处理画图

导入证书可以解决”无法建立到信任根颁发机构的证书链"问题。