没有合适的资源?快使用搜索试试~ 我知道了~
人工智能-语音识别-语音识别技术在智能业务中的应用研究.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 146 浏览量
2022-06-28
08:12:25
上传
评论
收藏 2.09MB PDF 举报
温馨提示
![preview](https://dl-preview.csdnimg.cn/85807275/0001-31f060e7636edb0c03fa00f2a22d8dae_thumbnail.jpeg)
![preview-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/scale.ab9e0183.png)
试读
60页
人工智能-语音识别-语音识别技术在智能业务中的应用研究.pdf
资源推荐
资源详情
资源评论
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![7z](https://img-home.csdnimg.cn/images/20210720083312.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/release/download_crawler_static/85807275/bg1.jpg)
第一章绪论
语音识别(ASR--Auto
Speech
Recognition)技术使得计算机实现了话务员耳朵
的功能,而文语转换TTS(Text
To
Speech)则实现了话务员的嘴巴的功能,将它们应
用子电信领域,可以使用户通过电话与计算机进行交谈,代替话务员的工作,会使公司
减少成本、提供友好的服务界面(可以省去烦琐的菜单式服务,从而提高了应用的简便
程度和客户的满意度)、增加电话接通率等等。虽然从技术的角度来看ASR和TTS已基
本达到了可实用的阶段,但其在电信领域的应用尚有很多问题需要研究和探讨。
本文根据电信领域智能业务对语音识别功能的特殊需求,将业界领先的语音识别系
统(为保密命名为X2000)集成于智能业务中,并着重对如何提高识别性能进行了探讨。
§1.1语音识别的历史发展
语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别
的一个分支,是集声学、人脑学、神经科学、生理学、人工智能、模式识别、信号处理、
计算机以及语言学等诸多学科于一体的交叉性学科。
语音识别的研究工作开始于五十年代。1952年,贝尔实验室Davis等人根据语音
信号的第一第二共振峰特征,实现了第一个可识别十个英文数字的语音识别系统——
Audry系统。这个时期,语音处理理论很不成熟,抽取特征的方法大多是用带通滤波组
提取频谱参数或语音信号共振峰,采用的结构也大多是计算机或专用硬件计算机的识别
系统,模式匹配时忽略语音内在的可变性,因此,识别效果并不好。但它的重大贡献在
于初步建立了一套完整的语音识别体系方法:即通过特征描述、模板建立、对输入语音
实现模板匹配,从而达到语音识别的目的。随后,到1956年,Duddley和Balashek等人
改进了共振峰检测算法,相继提出短时谱、FFT倒谱等,大大丰富了获取语音特征的手
段。
六十年代,计算机的应用推动了语音识别的发展。Saito、Itakura和Atal等提出了动
态规划DP(Dynamic
Programming)和语音信号的线性预测方法LP(Linear
Predictive),
其中后者为完整描述语音信号提供了良好的解决方案,对语音识别的发展产生了深远影
响。在这段时期,听觉感知实验结果和人耳生理研究成果被用于语音信号的描述。Pols
等提出了将人耳临界带宽随时间变化的特性引入带通滤波组设计,从而产生了语音特征
的另一种主要形式MFC(Mel-Frequence—scale
cofficients)参数,听觉感知知识的加
入进一步提高了语音识别器的性能。
七十年代是语音识别研究的兴旺期,在识别理论上有了重大突破。随着谱分析和模
式识别方法的发展,建立了语音信号产生的全极点模型。线性预测编码技术LPC(Linear
Predictive
Coding)得到迸一步发展。此后相继出现的LPC倒谱、短时能谱、Mel倒谱等,
![](https://csdnimg.cn/release/download_crawler_static/85807275/bg2.jpg)
结合听觉模型实现了语音信息的描述,有效地提高了识别器对噪声的鲁棒性。在语音识
别的算法上,为了解决不同音素之间的特征匹配,Satcoe和Criba等人提出了动态时间
归正方法DTW(Dynamic
Time
Warping)来匹配两个音长不等语音特征模式,运用最
优化技术把语音特征序列对时间轨迹进行非线性规正。这种对输入语音与参考模板之间
特征序列的非线性规正匹配,可以适应发音速度变化,被誉为语音识别技术发展的历史
性成就。
八十年代,不论在语音特征表示,还是识别方法上均有较大发展。出现了许多基于
音素识别、音节识别、单词识别和连续语音识别以及知识库的语音识别理解系统。著名
学者Rabiner、Baker、Cave等人,相继引入了隐马尔柯夫模型(HMM),通过Markov
链较好地描述了语音信号中的动态信息,并继承了统计模式识别算法的优点,因而在语
音识别中取得了较高的识别率。HMM模型的提出和建立是语音识别技术发展历程中的重
要的里程碑。
进入九十年代,语音识别新方法层出不穷。HMM模型理论得到了进一步的完善,
神经网络、小波理论等新的研究成果给语音识别不断注入新的活力,很多实用性的产品
开始涌现,语音识别的方法研究思路广开,迅猛推进。国外许多研究机构都研制出词汇
量达到几万的大词汇量识别系统。以卡内基·梅隆大学(CMU)推出的SPHINX系统为
代表,它能识别包括997个词汇的连续语句,识别率达到95.8%,突破了非特定人、连
续语音、大词汇量三大语音识别技术难题,被世界公认为语音识别技术发展的一个里程
碑。此外,DRAGON公司的NUTRALY
SPEA
KING和旧M公司的VIA
VOICE等
商用产品相继问世,掀起了近两年语音识别技术新的高潮。旧M、MICROSOFT、INTEL
等业界巨头纷纷斥巨资将语音识别技术列为未来主要的技术发展方向,语音识别经过长
期的探索研究,开始全面走向实用。
国内语音识别研究起步于1958年,当时由中科院声学所实验用电子管电路识别10
个元音,由于科研设备的客观条件的限制,研究工作进展缓慢。1973年,开始计算机语
音识别,中科院自动化研究所、清华大学等单位陆续加入语音识别的研究行列。目前有
近百家单位机构从事该方面工作。其中中科院自动化所、清华大学、声学所、北方交大、
西安电子科技大学等单位结合汉语本身的特点,在基础理论、算法模型、使用系统等方
面做了大量工作,取得了一批重要成果。
九十年代初期,我国相继研制成功一些中小字表的汉语语音识别应用系统。如清华
大学研制的声控电话查号系统,中科院自动化研究所研制成功的基于音节的口呼文本输
入系统等,四达公司还推出了汉语语音打字机商用产品。与此同时,台湾在汉语语音识
别方面也取得了较高水平,其中以李琳教授研究小组开发成功的“金锺一号”最为出色。
在此期间,语音识别的重点放在汉字孤立音节识别上。自90年代以后,在非特定人、大
词汇量、连续语音三大语音识别技术难题方面,清华大学、中科院自动化等单位在“863”
![](https://csdnimg.cn/release/download_crawler_static/85807275/bg3.jpg)
![](https://csdnimg.cn/release/download_crawler_static/85807275/bg4.jpg)
1
香港
以中文为主,非特定人、中等词汇量、连续语音识别。全球酋套拥有中英
Info-T矗Ik
混合语言的识别系统,能听能讲普通话、广东话和英语,还可以高度适应
不同的口音,因而可以广泛适用于不同文化背景的使用者,尤其是中国地
区语言差别较大的广大用户。
2
美国Nuance
非特定人、大词汇量、连续语音识别,识别准确度高。
Nuance开发销售
了自然语音接口软件。美国航空、BellAtlantic、UPS等大公司使用Nuance
的软件来为客户挺供更好的服务。
3
Brite
Voice
系统集成商,软件开发商和服务提供商,主要领域集中于语音处理。
Systems
Edcsson从Brite获取语音拨号服务。
五
Dragon
开发和销售多语种的语音技术.主要应用包括语音命令和控制系统,通过
Systems
语音访问数据等.
5
Glenayre
有一个语音处理系统MVP一提供大型基于消息的应用.Motorola和Nortel
网络使用了该系统,有许多语种驱动的特性。KPN电信在它的网络上集成
了Glenayre的技术,提供用户语音拨号功能.
6
IBM
开发了一个叫做ViaVoice的语音识别软件.IBM和它的合作伙伴在Voice
TIMES小组中试图将该产品集成到更多的系统中去,并且制定相关标准.
7
Vocalis
在固定电话、移动和JNTERNET平台上提供一系列的语音识别和呼叫处理
的应用.提供的SPEECHtel是一个智能外设,提供给固定和移动用户语
音驱动的服务.提供的SpeechHTML语音识别技术,允许WEB站点为用
户提供交互式电话服务.
8
Voice
为电话系统中的用户提供语音识别软件.
ControI
Systems
9
Lemout
and
提供的语音产品向多媒体计算机和电信应用提供语音识别和语音合成。
Hausple
L&H也从事导航系统中的语音识别。
10
WIdfire
开发了语音驱动界面技术和个人电子助理.有两个提供增值服务的软件:
Communicat
Enterprise
Wildfire--为公司网络提供服务Network
Wildfire--为电信用户
ions
提供个人助理服务。服务包括语音拨号,语音控制的语音邮件,智能呼叫
等待,呼叫路由,组消息,地址本.
11
GenemI
Protico提供语音拨号和文语转换功能,通过语音访问EMAIL和收发传真
Magic
等.MagicTalk提供语音用户界面.
§1.3语音识别系统商用化面临的问题
目前世界各国都加快了语音识别应用系统的研究开发,并已有一些实用的语音识别
系统投入商业运营。
在电信领域的智能业务中,电话语音识别技术的商用超越了电话
按键层层查询的应用时代,已经可以做到通过电话与电脑交谈。比如说用户想查询股票
![](https://csdnimg.cn/release/download_crawler_static/85807275/bg5.jpg)
信息,电脑已经可以根据用户的语音提示,自动找寻并报出股票信息,电脑的语言识别
系统已可以理解用户要查询的内容。现有的语音识别技术已足够推动应用水平向前迈进
一步,它会给用户带来效益上的提高,并为企业赢得巨额收入。
目前国内电信领域中对语音识别的应用还不多,如何把比较成熟的ASR系统集成于
电信领域智能业务中,尚有很多实际的问题需要研究和探讨。
具体表现在:
1)如何确定语音识别功能在智能业务中的集成位置:
2)如何将语音数据从电话端实时传送到识别服务器;
3)如何提高语音识别系统的识别率;
4)如何提高语音识别系统的识别速度等等。
所有这些都对语音识别的具体应用和商用化造成了很大的影响,如何解决这些问
题,使得语音识别系统集成达到实用化水平,已成为系统集成的一个重点。
§1.4论文的主要工作
本文研究的主要目的是实现语音识别技术在智能业务中的集成应用,并针对如何提
高应用系统的识别性能,在语音信号增强、端点检测、打断(Bargeln)、识别模型等
方面进行了研究和优化,使得应用系统达到了实用化的要求。
全文共分为五章,内容安排如下:
第一章回顾总结了国内外语音识别技术的发展历史及现状,分析了语音识别商用
化面临的问题,针对存在的问题介绍了作者所进行的研究工作并概述了本
文的研究内容。
第二章介绍了语音识别技术的一些基本理论、×2000识别系统的识别原理以及智
能业务应用系统。
第三章详细描述了X2000识别系统在应用系统的语音平台中的具体实现,主要包
括背景概述、总体设计、关键设计、运行设计、属性设计等。着重对集成
设计思想、用于识别的语音数据的实时传送、识别功能的具体封装实现、
语音识别功能实现过程的消息流等做了说明。
第四章针对集成了语音识别功能后的智能业务应用系统的识别可信度偏低、识别
响应时间偏慢的情况,从改善语音信号质量和调整识别模型两个方面对应
用系统进行了性能优化,使得应用系统基本达到了实用化水平。
第五章总结了作者的主要工作,分析了现存应用系统中存在的一些问题,对语音
识别技术达到完全、自然、可靠的商用化要求所需进行的探索做了进一步
展望。
剩余59页未读,继续阅读
资源评论
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/default.jpg!1)
programhh
- 粉丝: 8
- 资源: 3838
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)