没有合适的资源?快使用搜索试试~ 我知道了~
汉语文语转换系统.pdf
5星 · 超过95%的资源 需积分: 10 8 下载量 130 浏览量
2009-08-29
14:40:24
上传
评论
收藏 382KB PDF 举报
温馨提示
试读
54页
针对语音合成自然度不够理想的问题,文章提出了语音单元之间平稳过渡的改进方法和在分词基础上的词的组合方法,给出了一些短语的组合规则,并对合成中的语气处理规律进行了探讨。
资源推荐
资源详情
资源评论
- -
I
摘 要
简单介绍了汉语文语转换系统(TTS)的发展情况,以及目前语音合成
的几种方法简介。针对波形拼接语音合成技术,给出一种基于时域基音同步
叠加(TD-PSOLA)技术进行调整汉语语音波形的方法。并利用 TD-PSOLA
原理调整合成语音的能量、音高和时长。根据语音短时能量和过零率相结合
来精确定位语音音节的起始点。给出一种改进的基于语音短时自相关函数的
基音周期提取使用方法。进而提取基音标记点。针对语音合成自然度不够理
想的问题,文章提出了语音单元之间平稳过渡的改进方法和在分词基础上的
词的组合方法,给出了一些短语的组合规则,并对合成中的语气处理规律进
行了探讨。从而使合成的语音比较自然。
关键词 基音同步叠加 语音自然度 合成规则 基音周期 自相关
- -
II
Abstract
This paper introduces a Chinese Text-to-Speech system .and describes speech
synthesis technology based on waveform compilation.which is rapidly
development. In this paper, an Chinese speech waveform coding synthesis is based
on the time domain pitch-synchronous-overlap-add(PSOLA) method is
presented. and can adjust synthetic speech pitch and duration with the time domain
PSOLA.We can get the precise beginning point of Chinese syllable in terms of
short-time average energy zero-crossing rate of Chinese syllable and extract the
pitch period using traditional short-time auto-correlation function.Because the
natural degree of speech synthesis is not good enough, this paper puts forward
two methods,one is an improved method of smooth transition between phonetic
units.another is a method of word combination based on segmentation.Besides,
It also summarize on tone processing in synthesis.This paper presents some rules
and laws to improve the natural degree of speech synthesls.
Key words Pitch synchronous overlap add natural degree of phonetic
The synthetic rules pitch period auto-correlation
- -
1
目 录
摘 要 ...................................................................................................................I
Abstract ............................................................................................................II
第 1 章 绪论 ...................................................................................................... 3
1.1 课题背景 ............................................................................................. 3
1.1.1 文-语转换系统 TTS ........................................................................ 3
1.1.2 现有的合成技术 ....................................................................... 4
1.1.3 韵律合成实验系统的模块结构示例 ....................................... 5
1.2 本文内容 ............................................................................................. 7
1.3 本章小结 ............................................................................................. 7
第 2 章 提高波形拼接自然度的探索 .............................................................. 8
2.1 韵律规则的统计 ................................................................................. 8
2.1.1 五度制的标调法 ....................................................................... 8
2.1.2 语流音变规则 ........................................................................... 8
2.1.3 轻重音规则 ............................................................................... 9
2.1.4 音强规则 ................................................................................... 9
2.1.5 语气的处理 ............................................................................... 9
2.2 音节间合成的间隔规则 ..................................................................... 10
2.2.1 词组中音长规则 ....................................................................... 10
2.2.2 停顿规则 ................................................................................... 10
2.2.3 音节的平均长度 ....................................................................... 10
2.2.4 合成词的交叉规则 ................................................................... 11
2.2.5 调素论 ....................................................................................... 12
2.3 本章小结 ............................................................................................. 12
第 3 章 基音同步叠加算法概述 .................................................................. 13
3.1 算法背景 ............................................................................................. 13
3.2 基本原理 ............................................................................................. 14
3.2.1 基音同步分析 ........................................................................... 14
3.2.2 基音同步修改 ........................................................................... 14
3.2.3 基音叠加合成 ........................................................................... 16
3.3 本章小结 ............................................................................................. 19
- -
2
第 4 章 语音信号的时域分析 ........................................................................ 20
4.1 语音信号分析技术概述 ..................................................................... 20
4.2 语音信号的端点检测 ......................................................................... 20
4.2.1 短时能量分析 ........................................................................... 20
4.2.2 短时过零分析 ........................................................................... 23
4.3 查找语音信号的基音标记 ................................................................. 23
4.3.1 短时自相关 ............................................................................... 24
4.3.2 中心削波函数 ........................................................................... 26
4.4 小结 ..................................................................................................... 28
第 5 章 应用 PSOLA 对音节波形修改的实验............................................. 29
5.1 实验流程概述 ..................................................................................... 29
5.2 实验结果 ............................................................................................. 29
5.3 影响合成音质的分析与改进 ............................................................. 32
5.4 实验心得 ............................................................................................. 33
5.5 小结 ..................................................................................................... 34
结 论 ................................................................................................................ 35
致 谢 ................................................................................................................ 36
参考文献 .......................................................................................................... 37
附 录 1 外文文献译文 .................................................................................... 39
附 录 2 外文文献原文 .................................................................................... 45
- -
3
第 1 章 绪论
1.1 课题背景
1.1.1 文-语转换系统 TTS
一般来说,实现计算机语音输出有两种方法:一是录音/回放。先把
模拟语音信号转换成数字序列,编码后,存放在储存设备中(录音);需要
时,再经过解码,重建语音信号(回询)。这种方法所产生的音质能保留个
人的音色,但存储量随发音时间线性增长。所以仅适用于语音输出时间短
且不经常变化的场合。另一种方法就是文-语转换(TTS)。文-语转换是一
种高级的语音输出,它能把文本转换成连续自然的语流。采用这种方法,
先建立语音数据库、发音规则库。需要输出语音时,只要输入待发音的字
符,系统便能按语音规则输出语声流。文-语转换系统的语音库不随发音时
间的增长而加大,但规则库会随语音质量的要求而增大。
完备的文-语转换系统一般由语言学处理、语音学处理和语音合成这
三大部分组成。整个系统包括以下几个组成部分:文本预处理、分词处理
和分词词典、句法分析、多音字处理和多音字典、音变处理及韵律规则、
语音合成器以及语音数据库,如图所示。输入的文本材料经语言学处理、
语音学处理,得到语流控制参数,然后读取语音数据库,经语音信号处
理,输出连续语声流。
目前,包括汉语在内的各种的 TTS 系统的研究,都面临着如何提高输
出语音自然度的问题。对于这个问题,目前的研究主要围绕两个方面:一
是通过自然语言理解,从输入文本中提取语音韵律特征;二是根据韵律规
则,利用韵律修改算法,对欲输出的语流进行修改,从而得到良好的语音
输出。PSOLA 算法主要对后者提出改进方案。
韵律特征(Prosodic Feature)就是语流中由音高、音长和强度等方
面的变化所表现出来的特征,也叫作超音段特征。
剩余53页未读,继续阅读
资源评论
- hou8477126862013-08-19很有帮助!支持!
mickie2007
- 粉丝: 0
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功