个性化文本语音转换系统(TTS)的设计与实现1
需积分: 0 121 浏览量
更新于2022-08-04
1
收藏 1.52MB PDF 举报
个性化文本语音转换系统(TTS)的设计与实现
本文档主要介绍了个性化文本语音转换系统(TTS)的设计与实现,该系统能够将任意输入文本信息转换为语音信号,并且能够根据用户的个人喜好进行朗读角色的任意设定。该系统使用 Microsoft 提供的 Speech SDK 语音工具包实现 TTS 的基本功能,并建立了个性化语音转换函数,即语音转换模型,能够将源说话人的语音转换为目标说话人的声音特征。
该系统的主要功能包括:
1. 基于 Microsoft 提供的 Speech SDK 语音工具包实现 TTS 的基本功能。
2. 实现个性化朗读角色的设定,建立语音转换模型,实现系统语音转换成个性化朗读者语音。
3. 声音情感特征的分析和提取,求取不同情感间的转换关系。
4. 设计说话人识别系统,对语音转换结果进行评价。
该系统的实现过程包括:
1. 详尽地阐述了基于微软提供的 Speech SDK 语音工具包实现 TTS 的基本功能。
2. 然后,利用 Speech SDK 的 API 接口,将输入的文本内容准确朗读并且实现了中英文的混合朗读。
3.接着,为了实现个性化语音处理,本文建立了一个语音转换模型,语音转换是针对于源说话人和目标说话人,即使一段源说话人的语音转换后具有目标说话人的声音特征。
4. 本文使用 C++和 Matlab 混合编程设计和实现了一个个性化文本语音转换系统,既可使用系统自带的朗读角色也可根据个人喜好进行自定义,语音朗读的效果较为理想,验证了上述语音转化算法的有效性。
本文的关键词包括:TTS、个性化、情感因素、说话人识别、GMM 模型等。
本文的主要贡献在于:
1. 实现了个性化文本语音转换系统,能够根据用户的个人喜好进行朗读角色的设定。
2. 建立了语音转换模型,能够将源说话人的语音转换为目标说话人的声音特征。
3. 分析和提取了声音的情感特征,求取不同情感间的转换关系。
该系统的应用前景非常广阔,例如在汽车导航、电信的呼叫服务、公交车到站站名自动播报等领域都具有广阔的应用前景。