没有合适的资源?快使用搜索试试~ 我知道了~
语音识别技术人工智能论文-毕业论文.doc
3 下载量 20 浏览量
2023-07-08
16:40:40
上传
评论 2
收藏 50KB DOC 举报
温馨提示
试读
15页
语音识别技术人工智能论文-毕业论文.doc
资源推荐
资源详情
资源评论
一:前沿
语音识别技术是 2000 年至 2010 年间信息技术领域十大重要的
科技发展技术之一。它是一门交叉学科,正逐步成为信息技术中人机
接口的关键技术。语音识别 技术与语音合成技术结合使人们能够甩
掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有
竞争性的新兴高技术产业。
二:语音识别技术概述
语音识别技术,也被称为自动语音识别 Automatic Speech
Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计
算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识
别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其
中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、
室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技
术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以
构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉
及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和
听觉机理、人工智能等等。
语音识别是解决机器“听懂”人类语言的一项技术。作为智能
计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一
直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,
其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术
开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、
家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系
统等,几乎深入到社会的每个行业和每个方面。
三.语音识别的研究历史
语音识别的研究工作始于 20 世纪 50 年代,1952 年 Bell
实验室开发的 Audry 系统是第一个可以识别 10 个英文数字的语音识
别系统。1959 年,Rorgie 和 Forge 采用数字计算机识别英文元音和孤
立词,从此开始了计算机语音识别。60 年代,苏联的 Matin 等提出了
语音结束点的端点检测,使语音识别水平明显上升;Vintsyuk 提出了
动态编程,这一提法在以后的识别中不可或缺。60 年代末、70 年代
初的重要成果是提出了信号线性预测编码(LPC)技术和动态时间规整
(DTW)技术,有效地解决了语音信号的特征提取和不等长语音匹配问
题;同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。
80 年代语音识别研究进一步走向深入:HMM 模型和人
工神经网络(ANN)在语音识别中成功应用。1988 年,FULEE Kai 等用
VQ/I-IMM 方法实现了 997 个词汇的非特定人连续语音识别系统
SPHINX。这是世界上第 1 个高性能的非特定人、大词汇量、连续语
音识别系统。
进入 90 年代后,语音识别技术进一步成熟,并开始向市
场提供产品。许多发达国家如美国、日本、韩国以及 IBM、Apple、
AT&T、Microsoft 等公司都为语音识别系统的实用化开发研究投以巨
资。同时汉语语音识别也越来越受到重视。IBM 开发的 ViaVoice 和
Microsoft 开发的中文识别引擎都具有了相当高的汉语语音识别水平。
进入 21 世纪,随着消费类电子产品的普及,嵌入式语音
处理技术发展迅速[2]。基于语音识别芯片的嵌入式产品也越来越多,
如 Sensory 公 司 的 RSC 系 列 语 音 识 别 芯 片 、 Infineon 公 司 的
Unispeech 和 Unilite 语音芯片等,这些芯片在嵌入式硬件开发中得到
了广泛的应用。在软件上,目前比较成功的语音识别软件有:Nuance、
IBM 的 Viavoice 和 Microsoft 的 SAPI 以及开源软件 HTK,这些软件
都是面向非特定人、大词汇量的连续语音识别系统。
四.国内研究历史及现状
我国语音识别研究工作起步于五十年代,但近年来发展很快。
研究水平也从实验室逐步走向实用。从 1987 年开始执行国家 863 计
划后,国家 863 智 能计算机专家组为语音识别技术研究专门立项,
每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同
步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进
水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业
大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学
等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性
的研究单位为清华大学电子工程系与中科院自动化研究所模式识别
国家重点实验室。电子工程系语音技术与专用芯片设计课题组,研发
的非特定人汉语数码串连续语音识别系统的识别精度,达到 94.8%
剩余14页未读,继续阅读
资源评论
yyyyyyhhh222
- 粉丝: 408
- 资源: 6万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功