语音信号数字处理(L.R.Rabiner)

所需积分/C币:15 2013-07-24 10:09:13 9.75MB PDF

音频信号处理的经典教程,L.R Rabiner 编写。83版的。需要的下。
译者的话 近十几年来语音信号的数字处理在国外有了很大的进展,L.R,拉宾纳和RW,谢 弗合著的《语音信号数字处理》一书是对这方面所得进展的一个比较系统的总结 语音信号的数字处理需要有两方面的知识作基础、一是话言声学、一是数字信号处 理,虽然在这二方面都三经有些较好的著作,但是把语音信号数字处理作为一个专题 来写的茗作还很少,特别是作为一本教科书。就我们所知本书还是第一本.对于刚开始 这方面工作的读者在学习此书以后将能七较顺利地去魔读更加深人的文献 参抓本书翻译工作的有:杨为理(第二章及第九章前平部分),尹达衡(第码章及第九 章后半鄄分),曹志刚(第五章),诸庆麟(第六章),杨行峻(第七章,第八章),朱雪龙(前言, 第一章第三章及设计).由朱雪龙对全书译文进行统一和校对.由于译者的水平,译文 中难免有谬误和不妥之处热诚欢迎读者批评指正 译者 前 言 这书是我们两人长期合作的产物。这种合作当我们还是麻省理工学院歼究院的学生 时就已经开始了,随后我们又在贝尔实验室更加密切地合作了六年多,自此以后我们一 直是同事和学友。引起我们构思写作这书的是一篇关于语音信号数字表示的指导性文 章,这篇文章是我们为IEE会刊数字信号处理专刊写作的,专刊由麻省理工学院的 Alan Oppenheim教授主编.在我们写作那篇文章时我们感到语音信号数字处理这一领域 已经相当成熟完全可以在这一题目上写一本书 当我们相信我们可以而且准备就此题目着手写作时,我们面临的基本问题是如何来 组织这样一木书。我们考虑这书至少有三种不同的组织方法,而我们应当选择那种能对 这一领域的所有间题连贯起来进行统一处理的组织方法.我们所考虑的三种组织方法 是 1,按数字表示问题加以组织 2按参数估计问题加以组织 3.按各种不同的应用领域加以组织 在进行了多次讨论之后我们感到最基本的是那些与语音信号数字表示有关的概念, 同时对于这些表示从语声上加以理解和说明就可以使读者掌握和发展参数估计的方法和 技术以及语音处理系统的设计方法和技术,所以我们决定围绕着语音信号数字表示的几 种基本方法来组织这本书.同时作为各种表示方法的使用实例还讨论了某些专门的参数 估计技术及其应用。 本各章的内容如下:第一章对话音处理这一领域作一概括的介绍并简要地讨论了 它的各种应用,这些应用都是和全书将要讨论的议题紧密相关的.第二章扼要地回顾了 数字信号处理中一些最基本的知识.在这里我们假定读者在线性系统和傅里叶变换方面 已经有坚实的基础,在数字信号处理方面也至少已经学过最基本的课程。所以这一章本 身并不想提供这方面约基础,而主要是为以后讨论数字信号处理建立一些符号和表示方 祛.并使读者得以筒捷地了解数字信号处理中的一些关键的公式。此外,在这一章中还 广泛地讨论了抽样抽取和插值这祥一些关键的过程,这些对于大多数的语音处理系统来 说都是很基本的,第三章涉及语音信号的效字模型.在这一章中讨论了语声信号在声道 中产生的物理基础,根据这一基础我们得到了模拟这一过程的各种形式的数字模型.此 外,这一章也扼要袍介绍了语音声学,对语音的声学特性以及一些其它的物理特性进行了 讨论 第四章论述时域中的语音处理方法。它所包含的内容是有关语音数字处理中一些基 木概念的讨论,诸如短时能量、平均幅度、短时平均过零率和短时自相关该章的最后一 节是非线性平滑技术这种技术对于本章中所讨论的时城测量的平滑来说是特别适用的 第五章论述话音被形的直接数字表示,即波形编码器。在这里即时量化均匀的和非均匀 的)自适应量化差分量化和预测输码(固定的和自适应的)的概念都得到了讨论这些概 念构成了各种编码器的基础,从简单的脉冲编码调制(FCM)到适应差分PCM ADPCM)編码 对语音谱表示的讨论有二章,第六章是其中的前一章,该章讨论短时傳里叶分析的概 念和语音的综合,这一领域在传统上一直受到语音研究工作者最大的注意。困为一些 关锉的语音处理系统,如语谱仪和通道声码器都是和这一章中所讨论的概念直接有关系 的.我们在这里着重说明语音谱分析和综合这一极其普遍的方法如何为极其多样的语音 处理系统的讨论提供了基础.这些系统包括上提到的那些系统,第七章是语音谱表示 的后一章,讨论的是语音的同态处理,在同杰处理中用到的是这样一个概念就是把语音 波形(它很白然地可以用卷积表示)变换到频域中去使其成为几项之和,这些项又可以用 普通的线性滤波技术加以分离。作为同态语音处理的若干实例,我们在这章中讨论了实 现这一过程的枝术 第八章讨论语音的线性预测编码,这种表示方法根据一个假定的语音信号的线性系 统横型,对时变的语音波形迸行最小均方误差的通近.现在已经可以看到这种方法在很 多情况下都是一种有力的、可靠的和精确的表示语音信号的方法 最后一章对若千种语音处理系统进行了讨论,这些系统是用在人机语声通信中的 这一章“目的有二个:第一是为了对专用的语音处理系统提供一些具体的例子;第二是 为了说明我们在全书中所介绍的那些概念如何应用在一些有代表性的语音处理系统中 本章讨论的这些系统涉及计算机语声响应、说话人辨认和确认以及语音识别 全书内容打算作为语音处理方面一学期课程的教材.我们在每…章(从第二章到第 八章)的后面都附有一套有代祓性的习题,以配合讲课教学,我们希望通过这些习题能够 豇好地理解每一章的概念.为了很好地理解语音处理中的数学概念和理论性的概念,完 成一定数量的习题是必不可少的.然而,读者将会看到语音处理就其本性来说是经验性 质的,因而第一手的经验对于数字语帝处理的学习来讲是很重要的。在按展本书来讲授 这门课程时,我们感到可以这样来解决经验问题,这就是指定学生完成一个课程作业。作 业的内容选自以下三个方面: 1,文献綜述 2.硬件设计。 3.计算机上计算, 我们在第九章的末尾给出了这三方面建议作的题目和线索, L.R,拉宾纳 R.W,谢弗 目 录 译者的话 前官 第一章绪论……… 10本书的目的… 中■■自■■■■■旨會t■會■■■ 曾冒1■旷■■血。自■旷。『●■t四中如中。即·矿血即口中咖 1语音信号…………………………………………………………1 1.2信号处理……………………2 13数字信号处理… 鲁會 14数字语音处理 昏↓·晶■↓L已昏晶 略L即 ■电即。■ 15小转 血即■■■■■罪■p自即甲■身血 卜日q日p‘日‘自日日 参考文献 ↓婚■■即山罪4昌■■■自『■司■自會■『卩自■ψ甲■會會自』■日■咖幽自↓■■自■■鲁鲁卩自p■自自即聊b■自■■■司■■■甲■卩■會 第二章数字信号处理基础… 日·甲·■■■鲁■■q口■■中■『即身四■■血自如即中·甲由口晷■··自即自血即血口身■·聊血自■ 20引言 8 21离散时间信号与系统………… 22信号与系统的变换表示 10 23数字滤波器的基本原理 …………………………14 24抽梯……………………………………………………………19 25小结 口■■■看即噜■■聊申· …24 参者文献 …"…*…-…·……………A…"………“…24 习题………… ………………………s…s………25 第三章语音信号的教字摸型 30 30引 ψ啬▲■■b·■■■。↓■■■▲d↓郾b●■■■■hd■■■↓■■■b≯■■■4b↓如看卧d晶■晷■■备b『4冒■ 30 31语音产生的过程………………"…………………………………………………30 语音产生的声学理论 47 33无损声管模型………………………………………………………………64 34话音信号的数字模型… ■着↓着自甲 35小结… 82 叁考文鰍 83 习题… 84 第四章语音处理的时域方法 命■自咖司■●■·會會血■1·■■會■曾曹『幽自■十■『鱼■亻■■■t曾雪『■■■t『■自P會1曹1 …90 4.0引言 奇ψ■■1·h■■t·過4■■■ 會■■卩■·『中P■甲中曾■中幽血昏◆自肀P■ ………90 4.1话音信号的时间依赖处理 ◆■■pp歌由甲甲看即p。p根■电邮■即p甲咖血看罪电 90 4.2短时能量和平均幅度………… ■『中會晋旨會血口■■■幽血曾■會■會■ ■·■■ 93 43短时平均过零率…………………………………………r………98 44利用能量和过零作有话无话的鉴别…………………………………………100 45利用并联处理方法的基音周期估值………105 445短时自关函数………………………………………………107 47短时平均幅度差函数s………………………w"…115 1.8利用自关函数进行基音周期估值 鼻■一 49中值平滑和语音处理 ■郾。■■■■看■↓自 血122 4.10小结…… …"r”…*………………"………*…“……-125 附录 125 ·I27 习题 128 第五章语音浊形的数字表示…… 郾↓↓·↓▲亠L■▲■■L↓↓着 s…132 0引言 132 51语音信号的抽样… 32 52话音统计模型的回顾 ……""………"s133 53瞬时量化 昏■■啬■晋晶■■ :137 54自适应量化…… ………151 55值量化的一般理论… *60 56增量调制·………… …I67 57差值脉冲编码调制……… ……………………………王74 58冬种系统比较 ………………"*…*179 59直接的数字码变换……………………………………………………………181 5.10小绾 184 参考文献 ■■■『昏■■酽■■昏■■■亨■■『■■吾■『十■酽曾昏晉■昏■P备■■■ 省■■■ 184 习题 第六章短时里叶分析 192 6.0引言…………………………………,…s……………………192 6.定义及特性……………………………………………………………192 62数字滤波器组的设计 ………………………217 6.3利用快速傅里叶变换实现漶波器组相加法… 234 64语谱图的显示…………………………………………………239 65基音检测……………………………………………………………243 65综合分析法 中看中●鲁會 45 67分析一禁合系统 249 68小结… 早264 参考文献… ……265 习题………………………………………………………266 第七章同态语音处理………………………………………………………………………272 7.0引言… 272 71卷积同态系统 吾罪44导4吾吾}吾吾■山如即号4山吾品日A即日品品即如日日晶品日品如日罪日吾导吾甲 ●●聊●↓■ t272 72语音的复倒频谱………… …279 7.3基音检测… 74共振峰伟计 ■會會■·1 288 75同态声码器… 午會亡中鲁■ 295 7.6小结 ■·自聊t·甲罪咖斷■冒■■■■■曾t 卜會■雪Pt■rr ■■■一曲會■ >97 参考文献…… ■品日日4品4日日吾吾甲目目上日吾晶日Bh4A日+吾日日日4hb4■吾如4昌 斗·晶■d一L 298 习题………………………………………298 第八章语音的线性预测编码 80引言 …………..,……t,-…302 8r线性预涎分析的基本原理……………… ………303 82模型增益的计算 308 83线性预测编码方程組的解 311 84线性预测编码分析方程組的各种解法的比较… 贔↓士■t■如矗■■■■■d凸晶■■昏暑备■ 85预测误差信号……………… ………………321 86线性预测分析的频域解释 甲■·P甲■即甲·●导甲,●甲 ……………………………3I 87线性预测分析与无损声管模型的关系………………………33 88各种语音叁数之间的关系 …338 8.9用线性预测参数综合语音 …………“34 310线性预测編码参数的应用………………………………………………………342 81小结 347 参考文献……………… 138 习题 ………………………349 第九章人机语声通信的数宇语音处理 354 90引言 ●●血自●■中ψ中●·●自自咖即中咖·伊幽■■■和血■自■ ■會■冒■t■■■■■■自會■■■·中自音卓自血白 4 91语声应答系统…… ■■■血白■會自督■會會■T冒血1 ………355 92说话人识别系统 ▲口··b■·如··↓↓4 ……364 93语音识别系统… ■一一即 374 94三模语音通信系统 L晶郾 333 95小结……………… ·385 参者文献…………“…… 385 设计 387 汉英名词对照索引………r…390 第一章绪论 10木书的目的 本书的目的是想要说明怎样才能把数字信号处理的技术应用于话音通信有关的问 题,所以在这作为引言的…章中我们将对以下的问题作一般的讨论.这些同题有:语音 信号具有什么样的性质;数字信号外理技术是怎样在语音信号的研究中发挥它的作用以 及在语音通信中已经用上数字信号外理技术的主要应用领域有哪些? 1.!语音信号 语音的作用就是通信,对语音通信潜在能力的表征方法有好几种,一种高度定量的 办法是利用信息论的概念,这个概念是亩 Shannon引人的.按照信息论,语音可以用它 的消息内容或信息来表示.另一种表征语音的方法是为用携带这一消息信息的信号即语 声的波形.虽然信息论的概念在一些复杂的通信系统中已经起主宰的作用,但是在本书 中我们将会看到在实际应用中最有用的还是建立在波形或某些参量模型基础上的语音表 在考虑诺音通信的过租时,我们对这个过程作如下设想是很有帮助的.首先我们设 想有一个消息以某种抽象的形式表现在说话入的头脑里,在经过复杂的语音产生过程以 后这些消崽的信崽被变换成语声信号.在这个话音产生的过程中我们可以想象消息的 信息是用很多种方法表示的例如消息信息嘗先被变换成一组神经信号这个信号就去控 制发音器官(这就是舌唇、声带等的运动),发音器宫按照这些神经信号完成一系列的动 作,最后的结是是一个语声波在这个语声波中包含了原始消息中的所有信息, 通过语音进行交换的信息本质上具有离散约性质。这就是说它可以用一连串的单元 符号表示这些单元号取自一个很有限的符号集合根据这些符号我们可以把所有的 音进行分类,这些符号就是所谓音素.每一种语言都它自已特定的音素集合其总数一 般在30和50之间.例刘英语可以用一个含有42个音素的集合来表示(详见第三章) 信息论所涉及的中心问题是信息传递的速度,对于语音的信息传输速度我们可以作 如下粗略的伟计,由于发音器官的运动速度受到物理的限制所以入产生语音的平均速度 大约是每秒十个音素.假若莓一个音素用一个二进制数来表水,那么为了代表英话中的 全部音素用六位数码就完全足够了.现在假设平均速度是每秒十个因素,并忽咯相邻音 之间的相关性,这样就可以估计得语音的平均信息速度为60bi/s.换句话说,在正常 的讲话速度下,与话音等效的书面文字含有60bt/的信息。当然,语音的“实际”信息的 低限远高于这一速度,这是囚为在上配的估计中我们对很多因素来加考虑.例如说话入 的个性和情,说话的速度和语音的强等 在语音通信系统中,语音信号以多种方式进行发送、存储和处理。由于技术上的考 虑,语音信号的表示方法非之多,一般说来,在任何系统中,最主要献考虑有两点 1.要保存语音信号中的消息内容 2语音信号的表示形式应该便于传输和存储成者十分灵活可以对它进行各种变换 而不会使其中的消息内容受到严重损失 话音信号的表示应该使其中的消息内容很容易为听的入所提取或者自动地为机器所提 取,在这本书里我们将会看到语音信号(不是消息内容)的表示所要求的信息传输速率 以从500bt/一直到1Mbi/s.在设计和实现这些表示时,信号处理的方法起着重要 的作用。 1.2信号处理 信息加工和处理的一般问题表示在图:1中.在语音信号的具情况下,信息源就 是说话的人,观和测量的一般是语声的波形.信号处理包括下面几个达容首先根据 个给定的模型得到这一信号的表示,然后再用某种高级的变换把这一信号变成一种更加 方便的形式.最后一步是消息信息的提取和使用,这一步可以由听的人来完成,也可以用 机器自动完成.我们举这样一个例子,有一个系统它的功能是从一组说话人中间自动辨 认出某个说话人.它所用的语音信号表示可以是时依赖谱。信号变换可能是在整个句 子上对这个谱进行平均.把这个平均谱与预先保衣好的每个说话人的平均谱样板进行比 较,然后根据谱的相似程度辨认说话人,在这个例子中信号的“信息则悬说话人的个性 所以语音信号的处理一讲有两个任务:第一它是种工具,利用它可以得到语 音信号的一艇表示,这种表示可以用波形的形式也可以用参数的形式,第二、在把信号从 一种表示形式变换到另一种表示形式的过程中信号处理起着辅助的作用,变换后的表示 形式虽然从性质上讲它的普遍性可能要小些,但对某一特殊的应用来讲却是更加合适的 在本书中我们将看到大量的例子,这些例子充分说明信号处理在语音通信中的重要性 号 武测量 什号 号换 出号提取与利 图1,1信息加工和处理的一般示意图

...展开详情

评论 下载该资源后可以进行评论 2

尹明婕 还是很不错的!
2017-06-08
回复
baikbpzhaoz 拉宾纳的书确实好,不过图片不太清晰
2016-01-27
回复
上传资源赚积分,得勋章
相关内容推荐