【免费】个性化文本语音转换系统(TTS)的设计与实现1_文本转语音转换器设计资源-CSDN文库

需积分: 0 121 浏览量更新于2022-08-04 1 收藏 1.52MB PDF 举报

个性化文本语音转换系统（TTS）的设计与实现本文档主要介绍了个性化文本语音转换系统（TTS）的设计与实现，该系统能够将任意输入文本信息转换为语音信号，并且能够根据用户的个人喜好进行朗读角色的任意设定。该系统使用 Microsoft 提供的 Speech SDK 语音工具包实现 TTS 的基本功能，并建立了个性化语音转换函数，即语音转换模型，能够将源说话人的语音转换为目标说话人的声音特征。该系统的主要功能包括： 1. 基于 Microsoft 提供的 Speech SDK 语音工具包实现 TTS 的基本功能。 2. 实现个性化朗读角色的设定，建立语音转换模型，实现系统语音转换成个性化朗读者语音。 3. 声音情感特征的分析和提取，求取不同情感间的转换关系。 4. 设计说话人识别系统，对语音转换结果进行评价。该系统的实现过程包括： 1. 详尽地阐述了基于微软提供的 Speech SDK 语音工具包实现 TTS 的基本功能。 2. 然后，利用 Speech SDK 的 API 接口，将输入的文本内容准确朗读并且实现了中英文的混合朗读。 3.接着，为了实现个性化语音处理，本文建立了一个语音转换模型，语音转换是针对于源说话人和目标说话人，即使一段源说话人的语音转换后具有目标说话人的声音特征。 4. 本文使用 C++和 Matlab 混合编程设计和实现了一个个性化文本语音转换系统，既可使用系统自带的朗读角色也可根据个人喜好进行自定义，语音朗读的效果较为理想，验证了上述语音转化算法的有效性。本文的关键词包括：TTS、个性化、情感因素、说话人识别、GMM 模型等。本文的主要贡献在于： 1. 实现了个性化文本语音转换系统，能够根据用户的个人喜好进行朗读角色的设定。 2. 建立了语音转换模型，能够将源说话人的语音转换为目标说话人的声音特征。 3. 分析和提取了声音的情感特征，求取不同情感间的转换关系。该系统的应用前景非常广阔，例如在汽车导航、电信的呼叫服务、公交车到站站名自动播报等领域都具有广阔的应用前景。

个性化文本语音转换系统

（TTS）的设计与实现

作者姓名：潘鹤

指导教师：王义教授

单位名称：信息科学与工程学院

专业名称：计算机科学与技术

东北大学

2014 年 6 月

东北大学本科毕业设计（论文） Abstract

个性化文本语音转换系统（TTS）的设计与实现

摘要

语音技术是近半个世纪以来崛起的一门新型科学技术，主要包括语音识别技

术和语音合成技术。其中,语音合成是指将文本转化为人类可以理解的声音信号

的相关技术。事实上, 文字-语音的转换（简称 TTS）是近年来发展起来的一种

应用非常广泛的技术，它可以将任意输入文本信息转换为语音信号。因此,在汽

车导航、电信的呼叫服务、公交车到站站名自动播报中具有广阔的应用前景。

然而，当前的 TTS 大多仅能使用系统自带的朗读角色进行文本朗读，语速

平淡不具有任何感情色彩，在用户体验上欠缺了一些个性化元素。因此，本文根

据语音特征分析，建立了个性化语音转换函数，从而实现用户根据自己的个人喜

好进行朗读角色的任意设定，为后续的语音信号个性化处理奠定了理论基础。

本文首先详尽地阐述了基于微软提供的 Speech SDK 语音工具包实现 TTS 的

基本功能；然后，利用 Speech SDK 的 API 接口，将输入的文本内容准确朗读并

且实现了中英文的混合朗读；接着，为了实现个性化语音处理，本文建立了一个

语音转换模型。语音转换是针对于源说话人和目标说话人，即使一段源说话人的

语音转换后具有目标说话人的声音特征。此外，本文对于声音的情感因素进行研

究，提取分析不同情感语音的特征参数，获得了不同情感和中性语音间的转换关

系，使朗读出来的语音具有了用户需求的情感色彩。

最后，本文使用 C++和 Matlab 混合编程设计和实现了一个个性化文本语音

转换系统，既可使用系统自带的朗读角色也可根据个人喜好进行自定义，语音朗

读的效果较为理想，验证了上述语音转化算法的有效性。

关键词：TTS，个性化，情感因素，说话人识别，GMM 模型

东北大学本科毕业设计（论文） Abstract

Design and Implementation of Individuation Text-Voice

Conversion (TTS) System

Abstract

The voice technology is a new science and technology nearly half a century,

mainly including speech recognition and speech synthesis technology. Among them,

speech synthesis converts text into sound signals that human can understand. In fact,

text-voice conversion (abbreviated TTS) has very broad applications and it can

convert any text to voice signals. Thus, it has broad application prospects in car

navigation, telecommunications call and the bus train station names automatically

broadcast.

However, current TTS system only can speak text in system roles without any

emotion, so there is a little lack in personalization elements for user experience.

Therfore, after voice feature analysis, this article sets up personalization voice

convertion functions. So users can set any speaking roles by themselves. It also

establishes theoretical foundation for speech signal personalized processing.

Firstly, this article expounds TTS basic functions focused on Microsoft Speech

SDK. Then, using the API interface of Speech SDK, we can let the computer read the

text and achieve mixed reading in English and Chinese. Next, to get personalization,

we use a voice conversion model. Voice Conversion is for the source speaker and the

target speaker, namely converting a source speaker speech into a speech with target

speaker acoustic features. In addition, this article talks about voice emotion factors.

Extracting and analyzing different emotional speech feature parameters to get

conversion relationship among different emotions and neutral speech. Finally, we can

get a speech with emotional features meeting user need.

Finally, this article designs a personalization text-voice conversion system with

C++ and Matlab mixed programming. It reads text in both system roles and customed

roles. The speaking result is acceptable and the effectiveness of the voice conversion

algorithm is demonstrated.

剩余71页未读，继续阅读

资源推荐

资源评论

独角兽邹教授

粉丝: 39
资源: 320

个性化文本语音转换系统(TTS)的设计与实现1

语音助手的系统设计与实现

文本转语音(TTS)

文本语音转换

文本转换语音

TTS-1

微软语音TTS文本到语音转换系统

文本语音转换模块.rar

文本语音朗读源码（TTS）

文本语音转换器 v2.5.18.zip

1-tts.rar系统语音包

嵌入式TTS汉语语音系统的设计与实现

语音转换文字

TTS语音合成，实现用语音读取文本

一种基于AMBE-2000的语音系统的设计与实现

可支持语音到文本转换功能

C++实现文本转语音源代码（完整版）

语音转换TTS源代码

语音王手机TTS语音文件

文本语音转换支持库

文本语音转换器

文字转语音播音系统

文字转语音TTS

android 语音系统 TTS

TTS语音合成

delphi开发的TTS语音demo

win7 tts 文本转语音环境

易语言TTS引擎语音朗读

C++应用微软TTS实现文本语音阅读

跨软件的文本转语音APP的设计与开发.pdf

易语言TTS引擎语音朗读源码

最新资源