个性化文本语音转换系统(TTS)的设计与实现1

preview
需积分: 0 2 下载量 121 浏览量 更新于2022-08-04 1 收藏 1.52MB PDF 举报
个性化文本语音转换系统(TTS)的设计与实现 本文档主要介绍了个性化文本语音转换系统(TTS)的设计与实现,该系统能够将任意输入文本信息转换为语音信号,并且能够根据用户的个人喜好进行朗读角色的任意设定。该系统使用 Microsoft 提供的 Speech SDK 语音工具包实现 TTS 的基本功能,并建立了个性化语音转换函数,即语音转换模型,能够将源说话人的语音转换为目标说话人的声音特征。 该系统的主要功能包括: 1. 基于 Microsoft 提供的 Speech SDK 语音工具包实现 TTS 的基本功能。 2. 实现个性化朗读角色的设定,建立语音转换模型,实现系统语音转换成个性化朗读者语音。 3. 声音情感特征的分析和提取,求取不同情感间的转换关系。 4. 设计说话人识别系统,对语音转换结果进行评价。 该系统的实现过程包括: 1. 详尽地阐述了基于微软提供的 Speech SDK 语音工具包实现 TTS 的基本功能。 2. 然后,利用 Speech SDK 的 API 接口,将输入的文本内容准确朗读并且实现了中英文的混合朗读。 3.接着,为了实现个性化语音处理,本文建立了一个语音转换模型,语音转换是针对于源说话人和目标说话人,即使一段源说话人的语音转换后具有目标说话人的声音特征。 4. 本文使用 C++和 Matlab 混合编程设计和实现了一个个性化文本语音转换系统,既可使用系统自带的朗读角色也可根据个人喜好进行自定义,语音朗读的效果较为理想,验证了上述语音转化算法的有效性。 本文的关键词包括:TTS、个性化、情感因素、说话人识别、GMM 模型等。 本文的主要贡献在于: 1. 实现了个性化文本语音转换系统,能够根据用户的个人喜好进行朗读角色的设定。 2. 建立了语音转换模型,能够将源说话人的语音转换为目标说话人的声音特征。 3. 分析和提取了声音的情感特征,求取不同情感间的转换关系。 该系统的应用前景非常广阔,例如在汽车导航、电信的呼叫服务、公交车到站站名自动播报等领域都具有广阔的应用前景。
独角兽邹教授
  • 粉丝: 39
  • 资源: 320
上传资源 快速赚钱
voice
center-task 前往需求广场,查看用户热搜