没有合适的资源?快使用搜索试试~ 我知道了~
嵌入式系统/ARM技术中的基于嵌入式TTS汉语语音系统的解决方案
15 下载量 123 浏览量
2020-11-08
04:51:57
上传
评论
收藏 173KB PDF 举报
温馨提示
试读
3页
使计算机、带有人机交互的电器、仪表等能像人一样开口“说话”是科技工作者多年的研究目标。语言是人与人交流信息的一种手段,文语转换TTS(Text To Speech)是自动将输入文字转换成语音输出,并尽量使输出的语音效率流畅、自然的一类技术。 TTS系统主要需解决两个问题: ①文本分析,即语言学分析。该任务是将以文本广度输入的字符串转换成语言学的表述; ②语音合成。即根据语言学的内在表述信息合成语音。 TTS系统中的语音合成方法分为时域和频域两大类:频域方法主要有LPC参数合成及其振峰合成两种,其实质是在工程上实现语音生成模型,进而在终端特性上模拟发音器官。在目前阶段,频
资源推荐
资源详情
资源评论
嵌入式系统嵌入式系统/ARM技术中的基于嵌入式技术中的基于嵌入式TTS汉语语音系统的解决汉语语音系统的解决
方案方案
使计算机、带有人机交互的电器、仪表等能像人一样开口“说话”是科技工作者多年的研究目标。语言是人与人交
流信息的一种手段,文语转换TTS(Text To Speech)是自动将输入文字转换成语音输出,并尽量使输出的语音
效率流畅、自然的一类技术。 TTS系统主要需解决两个问题: ①文本分析,即语言学分析。该任务是将
以文本广度输入的字符串转换成语言学的表述; ②语音合成。即根据语言学的内在表述信息合成语音。
TTS系统中的语音合成方法分为时域和频域两大类:频域方法主要有LPC参数合成及其振峰合成两种,其实质是
在工程上实现语音生成模型,进而在终端特性上模拟发音器官。在目前阶段,频
使计算机、带有人机交互的电器、仪表等能像人一样开口“说话”是科技工作者多年的研究目标。语言是人与人交流信息的
一种手段,文语转换TTS(Text To Speech)是自动将输入文字转换成语音输出,并尽量使输出的语音效率流畅、自然的一类
技术。
TTS系统主要需解决两个问题:
①文本分析,即语言学分析。该任务是将以文本广度输入的字符串转换成语言学的表述;
②语音合成。即根据语言学的内在表述信息合成语音。
TTS系统中的语音合成方法分为时域和频域两大类:频域方法主要有LPC参数合成及其振峰合成两种,其实质是在工程上
实现语音生成模型,进而在终端特性上模拟发音器官。在目前阶段,频域方法形成的发音尚不自然,且需要的计算量很大,不适宜在
低端的嵌入式芯片上使用。波形编辑法是将较短的数字音频段(即合成基元)拼接并进行段音平滑后生成连续语流的方法。这
种方法占用的存储空间大,但计算量小、计算速度快,而且合成语音自然度较高,显然比较适合于芯片性能较弱的嵌入式系统方面
的应用。
采用波形编辑法的嵌入式TTS系统由于成本低、性能完善、自然度高,随着波形修改算法的不断提出以及微处理器和非易
失性存储介质功能的不断增强,正日益受到人们的关注。本系统即采用时域波形编辑技术,采集GB2312汉字编码字符集中所有
字符发音作为原始材料,通过使用改进的游程编码算法压缩生成可适用于当前Flash存储器的语音库,并采用多重查找表设计及预
存储命令字技术有效地加快语音库的寻址速度,在基于Atmel公司的AT89S52单片机上成功实现了一个TTS语音系统,经测试取
得了令人满意的效果。该系统应用简便,具有很小的尺寸和很低的功耗及通用的串行接口,可以广泛用于有关的汉语语音应用系
统中。
1 系统原理
图1为系统原理图框图以及主要操作流程。系统采用串行口与外界交互,任何具有标准串口的设备均可与本系统相连。欲发
音汉字的国标码(GB码)由串口送入MCU,MCU将其映射为Flash存储器地址表中对应项的地址,然后根据此地址取得对应项中
的命令字,由MCU根据该命令字读取该汉字发音对应的语音数据,连续读出语音数据并以游程码解码算法解码后,按照语音采样时
的固定速率通过D/A转换和功率放大播放。本文中语音采样速率为11025B/s。为满足应用需求,本文首先构建易于快速解码的
语音库,根据特定Flash存储器的存储格式,以快速多查找表寻址及命令字预先存储的方式组织并存储在Flash存储器中,以满足语
音播放的实时要求。同样,MCU的代码也要优先考虑速度而牺牲诸如模块化、可读性方面的要求。最后,出于实用性考虑,系统
中需加入足够的输入缓冲区支持,以满足一次输入多个流字或整句的要求。
原始语音数据的采集和处理
本系统共采集了1335种发音,内含1306个流字发音,26个英文字母发音及3个停顿音,语音采集卡AD转换整编11025B/s,分辨
率8位,样本值域0~255,静默值为80H。原始语音以WAV文件的格式保存在PC机中。
资源评论
weixin_38731479
- 粉丝: 3
- 资源: 916
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 论文(最终)_20240430235101.pdf
- 基于python编写的Keras深度学习框架开发,利用卷积神经网络CNN,快速识别图片并进行分类
- 最全空间计量实证方法(空间杜宾模型和检验以及结果解释文档).txt
- 5uonly.apk
- 蓝桥杯Python组的历年真题
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 前端开发技术实验报告:内含4四实验&实验报告
- Highlight Plus v20.0.1
- 林周瑜-论文.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功