论文研究-维吾尔语的重音检测.pdf

所需积分/C币:10 2019-09-08 05:45:52 486KB .PDF
收藏 收藏
举报

根据维吾尔语词重音的位置规律进行音节级标注,提取不同的特征参数(能量、基频等),对各个特征参数作单流、分流及特征级融合识别实验,对比分析各特征参数对重音检测识别率的影响。对融合后的高维单流特征采用主成分分析作降维、去冗余处理,并作识别实验。参照识别精确率结合语音语言学知识对实验结果进行分析。
金惠琴,努尔麦麦提·尤鲁瓦斯,吾守尔·斯拉木,等:维吾尔语的重音检测 2014,50(9)199 主成分因子 表1单流特征的重音检测结果(%) +ax (3) 特征 do 其方差var(F越大,表示F1包含的信息越多,故称F1 65.00 64.00 为第一主成分。 MFCC a1x1+a12k2+…+apx F2-a2X+a2x2+…+a2X MICC+ 89.18 54.22 MFCC+E+FO 82.26 62.07 F=a.X+aX,+.+aX 表2不同特征比例下识别结构比较() (1)F和F互不相关,Cov(F,F)=0。 MFCC: E+ O C Acc (2)F1是X1,2…,X的一切线性组合中方差最大 0.9:1.1 76.73 的,即Fm是与F,F2,…,Fm1都不相关的x,X2…x 57.02 的所有线性组合中方差最大者。 1.1:0.9 80.59 56.77 (3)F1,F2,…,F(m≤P)为构造的新变量指标,即原 1.2:0.8 变量指标的第1、第2、…第m个主成分。 3:0.7 4.02 56.45 1.4:0.6 85.10 56.15 5实验结果与分析 由上述表2可以看出随着MFCC比重的增加,其精 本实验使川5状态隐马尔可夫模型建立声学模型,确率呈现递增趋势但当其增长到14:06时其精确率有 对8500条(男4461条,女4039条,采样率为16kHz)语所下降,是因为插入错误发生次数较多,当MFCC:E+F0 吝数据的文本标注按音节切分。按照维吾尔语重音规比例为0.9:1.1时它的精确率呈现得最高。但与表1进行 则,将每个维吾尔单词的最后一个音节标泮为重音其比较,从整体上来说,单个流的实验结果要优丁多流。 余音节标注为非重音,并加入了词间停顿(sp)及静音(si)53PCA降维实验结果分析 模型。实验中引入流( stream),实际上就是验证重音参 为了使得重音檢测的识别率进一步提高,且为了去 数的各个特征对重音检测结果的影响,单流是指单个的除特征在直接叠加时,产生的特征冗余,本实验采川PCA 特征,而多流就是将不同的特征区分开来,可以通过调方法对特征参数的维数进行降维,分析对比降维前后的 节不同流的权重来分析哪些特征对重音检测更有意义。重音检测识别率的情况。 此外,还使用不同的单流声学特征,独立进行识别实验 图3横坐标代表高斯数,纵坐标代表精确率,由图 并分析单·特征对识别率的影响。 可以看出,通过PCA降维、去冗余的方法,在高斯数较 51单流实验结果分析 低的情况下,重音检测的识别率是有所提高的,提高率 特征级融合的单流特征各维都含有其一阶、二阶差最高可达到753%。 分系数。例如MFCC+E+FO,其含有12维的mlc,l维 的E和1维的F0,并加上其一阶、二阶差分系数,构成了 MFCC+E+F0、 42维的特征向量。本文中的实验以下面止确率(CORR) 和精确率(ACC)作为度量的标准。 60 CORP NREF-SUB-DEL x 100% (5) 40 NREF MFCC+E+FO PCA ACC- NREF-SUB-DEL-INSx1009 (6) NREF 其中¨NREF"表示代识别词的总数,“SUB”表示替换错 无$p加sp1246810 误的次数,DEL”表示删除错误的次数,“ⅠMS”表示插入 高斯数 错误的次数。 图3PCA处理后的重音识別精确率 由表1知,在单流情况下,融合后的短时能量与基 在维吾尔语中,词的重音在最后一个音节属于基本 频精确率最高为72.99%。在语音数据较多的情况下可现象,也可能出现在其他位置,由于重音移动到尾 以采用增加高斯数使得识别率有更进一步的提升。 音节与倾向于后加词级的现象并不是绝对的。维吾尔语 52多流实验结果分析 词成分中的辅音脱落、元音弱化等现象导致重首前移 多个流可以将多个数据源模型分离,表2的实验室将维吾尔语在发展历程屮受到另外一些语言的相互影响 MCC+E+0(含差分)分成两个流,并通过调节两个流的和复杂的变化等因素的影响,对其语吝结构带来了不同 比例来验证不同流屮不同的特征对识别精确率的影响。 (下转213页)

...展开详情
试读 3P 论文研究-维吾尔语的重音检测.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    weixin_38743506 如果觉得有用,不妨留言支持一下
    2019-09-08
    • 至尊王者

      成功上传501个资源即可获取
    关注 私信 TA的资源
    上传资源赚积分,得勋章
    最新推荐
    论文研究-维吾尔语的重音检测.pdf 10积分/C币 立即下载
    1/3
    论文研究-维吾尔语的重音检测.pdf第1页

    试读已结束,剩余2页未读...

    10积分/C币 立即下载 >