没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论



















I
摘 要
今天,数码语音技术已经发展成为一种时尚化智能化,人性化的代表技术,出
现在工业、交通、军事、安全保卫、教育、娱乐、体育、通讯、广告、旅游、休
闲、政治宣传等各个领域。
自然的语音、声音是稍纵即逝的,聪慧的人类想了很多办法来留存它们,这样
可以在任何需要的时候重复播放出来。这种保留原声的媒介曾有过钢丝、黑胶唱
片、胶片、磁带、激光唱片等等,这些媒介都需要精密复杂的机械传动装置来配
合,大多体积比较大,耗电大,控制不够灵活,有介质磨损,使用寿命有限。现在,
我们可以采用数码电子技术将纯的无任何机械的半导体集成电路(IC)去完成语声
信号的存储和还原,这样一类经过存储而还原播放的语言声音,我们称为 数码语
声。这类保存着数码语声的集成电路我们称为数码语声电路,或语声IC,有了这些
语声IC声音就能保留和还原,而且能被选择性地反复播放,也就能让不会说话的
各种物品发出声音或开口说话。语声IC具有体积小、耗电少、可控制性能好、永
无磨损、永久寿命等特点。它是采用电子处理技术将复杂的语声信号“切分”成很
多份,以最小的单位存储在自己内部的存储器里。当需要时,再把这些小份拼接
成完整的语声信号播放出来。
经由语声IC的处理、保存再回放出来的声音效果会比原声有一定的失真,现在
还原声音最好的是激光唱片方式,它的声音取样频率是44.1KHZ,取样位数是24位,
简单的说就是把一秒钟的语声信号横着切24份,再竖着切4万4千多份,累计把一
秒钟的信号切成了约100万份分别存储在激光唱片上,等播放时再拼在一起还原
出来,因此有较好的还原度。而语声IC因为制造技术和成本问题,其能够使用的
存储器容量比较小,大多数的语声IC都采用6KHZ5位采样,即大约把一秒种的信号
切成3万份,因此还原效果就要差不少。但随着技术的发展,这一差距正在减少。
语声IC的成本主要取决于内部电路的复杂程度和存储器的容量,在短时间语
声长度的产品中,语声IC的性能价格比是非常高,有的种类的语声IC价格低到只有
几分钱,这是任何其它数码语声还原设备无法比拟的。
关键词 语音;IC;存储器;声音;语音芯片

II
目录
摘 要∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙I
目录∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙Ⅱ
第 1 章 概述 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙1
1.1 国内外研究现状 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙2
1.2 语音播放的基本概念∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙2
1.3 语音芯片的分类 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙2
第2章 基于单片机的语音播放系统分析与设计∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙4
2.1 系统分析设计 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙4
2.2 单片机的选取 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙7
2.3 语音芯片芯片选取 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙7
2.4 语音芯片芯片选取.....................................................................................8
第3章 基于单片机语音播放系统的硬件设计∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙11
3.1 音频输入电路的设计∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙11
3.2 ISD1720 与 AT89S52 接口电路的设计 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙12
3.3 LED 数码管驱动电路的设计 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙12
3.4 单片机硬件电路设计∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙12
3.4.1 系统复位电路 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙13
3.4.2 时钟电路 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙13
3.5 电路板的制作 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙13
3.5.1 PROTEL 99SE 绘制原理图 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙14
3.5.2 焊接电路板∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙14
3.6 MAX232 的电路设计 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙14
第4章 基于单片机语音播放系统的软件∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙16
4.1 系统程序设计∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙16
4.2 KEIL3 程序汇编调试与 HEX 烧写 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙23
4.2.1 8051 开发工具 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙23
第 4 章 总结 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙26
参考文献 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙27
致谢 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙28
附录 1 电路原理图 ∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙∙29

1
第 1 章 概述
1.1 国内外研究现状
最近的十五年是电子行业突飞猛进的时期,语声 IC 的发展也见证了这一过程,
十几年前的产品几乎都被淘汰出局了,期间也曾有几十种语声 IC 不断被开发出来,
总的方向是集成度越来越高、功能越来越强大、音质效果越来越好、成本越来越低。
最后,经得住市场考验的,目前在通用市场上几乎只有三颗星星在闪耀。
一是 OTP 芯片 A8108A 、8208A 、840N 系列。这款芯片是美国 ISSI 公司大约
在 1992 年开发的,内部有 PROM 存储器,只能烧写一次。原设计只是掩膜语音芯片
的开发工程样片。过去用户在要求投产 MASKROM 语音芯片前,都希望厂家提供实验
用的工程样片,但大多数厂家都是提供一个由很复杂的分立器件电路搭建的开发评
估板——直到今天大多数厂家仍然如此,这板子很大只能和用户的电路接口模拟使
用,不能装入用户的产品中,更不能让用户小批量生产试投产,而且投产出来的掩
膜片与评估板的音质、管脚、电性能都有所不同,令用户风险很高。ISSI 公司就开
发了这一款芯片,而且设计了该芯片的开发工具,可以一起卖给用户做实验和小批
量生产,等试验成熟后再投大量而便宜的掩膜芯片。可以说它只是作为推销 ISSI 公
司掩膜芯片的一个促销手段来设计的,但是 OTP 芯片的快速开发、简单易控制等特
性引起很多设计工程师的青睐,一直使用至今。
另外,随着个性化时代的到来,产品的设计日益多样化,生产也朝着多品种、
少数量的方向发展,再加上市场的风云变幻加快,一般厂家用户越来越不敢动辄几
万、几十万地投产掩膜芯片,几乎都是先拿 OTP 片试打市场,看市场反应和接受程
度再来定夺。因此该系列产品的销量近年来反而增大了很多。美国 ISSI 公司在 2002
年停止了该系列产品的生产,目前由台湾的一家公司提供兼容的产品。二是 ISD 系
列产品。这款是美国 ISD 公司大约在 1994 年开发的,内部有 EEPROM 存储器,可
以反复擦写。ISD 的这款产品具有划时代的意义,因为它采用所谓“模拟存储技术”实
现了极好的语声还原效果,而且能录能放,控制简单灵活,同时有很强的智能控制,
令人耳目一新。该系列芯片经过原珠海特思高公司、原深圳矽源公司、原北京泰思
特研究所、北京中青世纪公司近十年的努力推广,目前已经是通用语声产品市场的
主流。其中值得一提的是,由于 ISD 芯片的控制有一定的复杂性,在 1996 年前又两
项比较大的难点阻碍其应用发展,一是 ISD 的技术资料一直只有很厚的英文资料和
很简单的中文资料,二是美国 ISD 公司提供的编程开发系统价格贵达 1. 8 万元/套,
都令开发技术人员寸步难行。1996 年上述几家公司联合起来翻译、编写、出版了《 ISD
全系列单片语音录放电路设计与应用汇编》,同年北京中青世纪公司自行开发成功了
ISD1425、ISD3340K 编程拷贝系统,价格降低到不足 2000 元/套,而且操作非常简单
方便。这两项工作的完成令 ISD 在国内的应用和推广起了关键性的作用。另外上述
几家公司都开发了很多围绕 ISD 设计的开发实验板、功能板等配套产品,也为技术
人员快速开发 ISD 语声产品提供了很大的帮助。

2
美国 ISD 公司大约在 1999 年被台湾的华邦公司收购,成为其一个子公司。这几
年 ISD 公司还推出了一些长时间的新产品,但在现在看来都不太成功。其原开发的
ISD1100、1400、2500、4000 系列产品,语声长度涵盖 10 秒至 16 分钟非常经典。 2002
年 ISD 公司又开发完成 ISD1800 系列产品,语声长度在 6~20 秒,以高音质、低价格
主打礼品玩具等低端市场,销售成绩非常显著。
第三颗星是 2003 年底刚诞生的 PM50 系列产品。这是北京中青世纪公司委托
台湾设计公司开发的新款语声 IC 系列,该公司一直是 ISD 产品在国内的最大技术
支持单位,非常熟悉电子市场和技术人员的需求,根据大量客户对 OTP 芯片和 ISD
芯片的需求反应专门开发了这款新的语声芯片。其特点是采用单片机 + 语音处理器
+FLASHRAM 结构,能反复擦写、控制较 ISD 简单方便、有 20 秒 ~200 秒一系
列产品较 OTP 芯片齐 全等,更 重要的是 开发人员 用编程好的文件既能够烧写
FLASHRAM 版本的 PM50 产品,也能交给厂家原样生产几个极为低廉的掩膜版本
的 PM50 产品,两者完全互换性能一致,这意味着国内的任何普通技术人员也能自
己设计、开发掩膜语声芯片。这也是数码语声电路发展历史上划时代的事件。
1.2 语音播放的基本概念
自然的语音、声音是稍纵即逝的,聪慧的人类想了很多办法来留存它们,这样可以
在任何需要的时候重复播放出来。这种保留原声的媒介曾有过钢丝、黑胶唱片、胶
片、磁带、激光唱片等等,这些媒介都需要精密复杂的机械传动装置来配合,大多
体积比较大,耗电大,控制不够灵活,有介质磨损,使用寿命有限。
现在,我们可以采用数码电子技术将纯的无任何机械的半导体集成电路 (IC) 去完
成语声信号的存储和还原,这样一类经过存储而还原播放的语言、声音,我们称为数
码语声。
1.3 语音芯片的分类
1、随录随放型的:
和磁带机一样,可以自由地通过话筒或模拟音频线路来进行录音,通过驱动喇叭
放音。这其中又分几类型。
怕断电的,语声保存需要很小的电流,象一些录音贺卡,它以 SRAM 静态存储
器 IC 为介质,断电声音丢失,保存电流很小。在录音贺卡等录音礼品中常将几粒
扣式电池嵌入到产品中,这样可以保存录音几个月甚至一年多。特点是可以较长期
保存语声。不怕断电的,象一些数码录音笔,它以 FLASHRAM 闪烁存储器 IC 为
介质,完全断电后语声还能保存十年以上。特点是价格较高。美国 ISD 公司的 ISD
系列就是这类产品。它生产从 10 秒至 16 分钟的一系列语声芯片产品。
2、编程录入的只放型:
象 MP3 随身听播放机一样,它的语声(音乐歌曲)录入需通过电脑、软件和专
用数字接口来完成,不能简单地通过话筒录入,因此其成本价格较前者低。这其中
根据使用存储器的种类不同又分以下几种类型,性能有所不同但其生产成本却相差

3
不大。
一次编程 OTP 型,芯片内部是 PROM 结构存储器,可以通过外部数字接口将语声
文件或程序文件烧录进去,但只能烧录一次,以后不能修改不能更换。ISSI 公司的
22C012/022/040(台湾公司的编号分别为 A8108A 、8208A 、840N) ,还有一些 OTP
型的语音单片机都是此类。
多次编程 EPROM 型,电路中用 EPROM 来存储语声数据,它需要专用的烧录工具
把语声数据放置在芯片中,这种芯片可以反复烧录,寿命在几十年,次数多了以后就会
有一定的单元损坏这是比较早期的数码语声电路构成方式,通常是语音处理 UM5100
加 上 外 挂 的 EPROM 老 式 的 公 交 车 语 音 报 站 系 统 多 采 用 这 种 方 式 。 反 复 编 程
FLASHRAM 型,电路中用 FLASHRAM 来存储语声数据,它需要专用的烧录工具或专
用数字接口把语声数据放置在芯片中,这种芯片可以反复烧录,寿命可达到 1 万次以
上。这是最新的数码语声电路构成方式 ,现在流行的 MP3 播放器就是这种方式。中
青世纪公司新开发的 PM50、PM64 系列也是这一类。
3、掩膜生产的只放型:
和 CD 机一样,拿到手的就是定制好的语声,自己不能更改,只能播放这类产品
的成本最低。在客户需求方面可以分两类:
标准声源型,这是指在电子市场上可以买到的通用语声芯片,例如各种警报声、“倒
车倒车请注意”、“这张是假币”等等。它们是大批量生产出来的标准品,价格非常便
宜。如果用户能确认可用,将是投资最少见效最快的选择,只是不能根据自己的情
况做任何变动,包括语声的音调、音质、触发控制方式等。
定制声源型,这是用户有自己的特殊要求而专门制作生产的,需要经过设计开
发、制作样片,确认样品,几万片起做的芯片投单,确认芯片,交货等几个过程,
制作和生产周期约 45 天,一次投资一般大约在 15 万元(人民币)以上,投资均摊在每
个芯片上,数量越大价格越低。
一直以来,这类芯片的开发和投产在用户和开发商都存在比较大的风险,因为
它不能小量快速生产,没有一个小批量的生产测试和市场投放的过程,而且开发商
提供的实验样品和最后交付的产品有一定的差别(音质、管脚、电性能等),因而容
易出现用户拒绝收货的情况。给双方都造成很大损失。
剩余28页未读,继续阅读
资源评论


悠闲饭团
- 粉丝: 104
- 资源: 2621
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


会员权益专享
安全验证
文档复制为VIP权益,开通VIP直接复制
