【免费】数字信号处理实验汇总报告资源-CSDN文库

大连理工大学

需积分: 0 175 浏览量 2024-07-30 10:25:33 上传评论收藏 1.07MB PDF 举报

资源推荐

资源详情

资源评论

简单的语音合成

一、实验目的

本实验完成了利用 python 中的 pyttsx3 库和 pygame 库实现语音合成功能，通过相

关逻辑的设置，在播放语音的过程中暂停或者继续播放，在上述基础上，增加了读取功

能（可以自己选定要读取的文件），翻译功能（基于百度 api，自动识别输入文本，支持

中英文互译），保存功能（将朗读的音频文件保存为 mp3 文件），设置功能（可以改变音

量、语速、音色）得到了使用 tkinter 库设计界面的声音播放器系统。

二、实验原理

2.1 语音合成功能

2.1 pyttsx3 库的使用

Pyttsx3 是一个用于文本到语音转换的 Python 库，可以将文本转换为语音并播放

出来，也可以设置语速、音调和音量等参数。

我们在这里主要使用 pyttsx3 来进行文本到音频的转换，但是考虑到在 pyttsx3 中

无法进行音频的暂停与继续播放（指的是不可以在暂停的地方继续播放），所以我们这

里只用 pyttsx3 来将文本生成 wav 音频文件，并将其保存在 temp 文件夹中，这里的 temp

文件夹起到一个临时文件的作用。在这里有两点需要说明，一是为什么不用 pygame 朗

读文本，这是因为 pygame 并不能直接将文本转化为音频输出，需要读取音频文件，二

是为什么不使用 mp3 格式，这是因为在一些说法中表示 pygame 对于 mp3 格式的文件支

持有限，可能会无法播放，实际中我就遇到了这个问题，所以我使用 wav 文件来作为音

频的临时存放处。

此外， pyttsx3 还提供 engine.getProperty()方法来返回此时的音量（volume）、

语速（rate）、音色（voices）参数，并可以通过 engine.setProperty()来修改对应参

数，达到调整的目的。

2.1.2 pygame 库的使用

Pygame 是一组专为创建视频游戏而设计的 Python 模块。它提供了处理图形、声音、

输入设备等功能。

我在这里使用的是它的 mixer 模块，mixer 模块在 pygame 里常用来处理声音，它提

供了 pygame.mixer.Sound()来读取音频，使用 play()来来播放音频。但是由于 play()

会创建一个新的播放实例，这就会导致多次调用 play()方法会有多个音频实例同时播

放，这与我们的理念不符，而且 Sound 对象没有暂停方法。所以，我们使用 pygame,mixer

def show_settings_window():

def on_radio_click():

selected_option = var.get()

if selected_option == 1:

voices = engine.getProperty("voices")

engine.setProperty("voice", voices[0].id)

elif selected_option == 2:

voices = engine.getProperty("voices")

engine.setProperty("voice", voices[1].id)

# 这是有关于窗口的设计

settings_window = tk.Toplevel(root)

settings_window.title("设置")

settings_window.geometry("600x250")

label1 = tk.Label(settings_window, text="音量:")

label1.pack()

text1 = tk.Text(settings_window, height=1, width=20)

volume = engine.getProperty("volume")

text1.insert("1.0", volume)

text1.pack()

label2 = tk.Label(settings_window, text="语速:")

label2.pack()

text2 = tk.Text(settings_window, height=1, width=20)

rate = engine.getProperty("rate")

text2.insert("1.0", rate)

text2.pack()

label3 = tk.Label(settings_window, text="英语音色（中文朗读选择 1）:")

label3.pack()

var = tk.IntVar()

radio_button1 = tk.Radiobutton(settings_window, text=" 音色 1", variable=var,

value=1,command=on_radio_click)

radio_button1.pack()

radio_button2 = tk.Radiobutton(settings_window, text=" 音色 2", variable=var,

value=2,command=on_radio_click)

radio_button2.pack()

def save_settings(): # 有关于选择音色的设计

item1 = text1.get("1.0", "end-1c")

item2 = text2.get("1.0", "end-1c")

item3=var.get()

engine.setProperty("volume", float(item1))

engine.setProperty("rate", float(item2))

engine.runAndWait()

messagebox.showinfo("设置成功",f"音量: {item1}\n 语速: {item2}\n 英语音色: 音色

{item3}")

settings_window.destroy()

save_button = tk.Button(settings_window, text="确认", command=save_settings)

save_button.pack()

剩余27页未读，继续阅读

内容反馈

weixin_74249132

粉丝: 0
资源: 2

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip