没有合适的资源?快使用搜索试试~ 我知道了~
人工智能-语音识别-基于DSP智能驾驶的语音识别系统研究.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 173 浏览量
2022-06-28
00:29:49
上传
评论
收藏 1.81MB PDF 举报
温馨提示
试读
65页
人工智能-语音识别-基于DSP智能驾驶的语音识别系统研究.pdf
资源推荐
资源详情
资源评论
Abstract
II
Abstract
In recent years, research on speech recognition technology is very active, and it’s
theory and implementation has made a major breakthrough. Using speech recognition
technology products are more and more, and coverage is quite extensive, such as in the use
of electronic communications systems, military, transportation, industrial, medical and so
on. Speech recognition technology has become a challenge for high and new-tech industry
is highly competitive, which inspired the strong interest of researchers and in-depth
research on the technology.
In this paper, the basic theory of speech recognition technology and its research status
at home and abroad are analyzed , proposed an improved speech recognition algorithm,
and the algorithm as the core to establish a speech recognition system, and finally in
Matlab and TMS320C6713DSK platform respectively simulation and experimental
validation of the system .
Speech recognition system of core algorithms mainly consists of pre-emphasis and
sub-frame window of pre-processing, the endpoint detection, feature parameters of the
calculation, DTW (dynamic time bending) algorithm, the improved DTW algorithm, SVM
(support vector machine), grid search parameter optimization and genetic parameter
optimization algorithm and improved DTW/SVM algorithm. In this paper, on the first of
these algorithms in Matlab platform simulation, and then the corresponding C code and
assembly code to write on CCS software platform and debug, and ultimately burns wrote
to DSK6713 on the development and application board of validated speech recognition
system is implemented at the hardware development. DSK6713 and TLV320AIC23 voice
capture chip as the entire hardware core, set to system initialization, the speech signal
acquisition and training, implementation the core speech recognition algorithm, display the
recognition result and other functions.
Finally, analysis of the experimental results and the performance of the system in
Matlab and DSK6713 platform, and summarize subject all the work, pointed out the
direction of future research topics and improvement.
Key Words: Speech Recognition;MFCC;DTW;SVM;DSP
目 录
III
目 录
摘 要 ......................................................................................................................................I
Abstract..................................................................................................................................II
第一章 绪论 ......................................................................................................................... 1
§1.1 选题背景及意义 ................................................................................................... 1
§1.2 语音识别系统的研究现状 ................................................................................... 2
§1.3 语音识别技术目前遇到的问题 ........................................................................... 3
§1.4 本文的主要工作安排 ........................................................................................... 3
第二章 语音信号的前端处理和特征提取 ......................................................................... 5
§2.1 语音信号的数学模型 ........................................................................................... 5
§2.2 语音信号的前端处理 ........................................................................................... 6
§2.2.1 预处理 .......................................................................................................... 6
§2.2.2 端点检测 ..................................................................................................... 8
§2.3 特征参数提取 ..................................................................................................... 12
§2.3.1 LPCC 参数 ................................................................................................. 12
§2.3.2 MFCC 参数................................................................................................ 14
§2.4 本章小结 ............................................................................................................. 16
第三章 语音识别算法及 Matlab 仿真分析...................................................................... 17
§3.1 DTW 算法及其在 Matlab 的实现....................................................................... 18
§3.1.1 DTW 算法.................................................................................................. 18
§3.1.2 DTW 算法在 Matlab 的实现..................................................................... 20
§3.2 改进的 DTW 算法.............................................................................................. 21
§3.3 支持向量机 ......................................................................................................... 23
§3.3.1 统计学理论的主要内容 ........................................................................... 23
§3.3.2 最优分类面 ............................................................................................... 25
§3.3.3 SVM 核函数 .............................................................................................. 27
§3.3.4 多类分类 SVM ......................................................................................... 28
§3.4 基于 Libsvm 对 SVM 最佳参数寻优及实验分析 ............................................ 29
§3.4.1 Libsvm 工具箱 ........................................................................................... 29
§3.4.2 网格搜索算法 ........................................................................................... 31
§3.4.3 GA 遗传算法 ............................................................................................. 32
§3.5 DTW 算法与 SVM 算法的结合 ......................................................................... 35
目 录
IV
§3.6 本章小结 ............................................................................................................. 36
第四章 语音识别算法在 DSP 上的实现.......................................................................... 37
§4.1 TMS320C6713 DSK 简介 ................................................................................... 37
§4.2 识别系统的硬件结构 ......................................................................................... 38
§4.2.1 语音数据采集模块 ................................................................................... 38
§4.2.2 数据传输模块 ........................................................................................... 41
§4.2.3 存储器模块 ............................................................................................... 43
§4.2.4 电源模块和其他模块 ............................................................................... 44
§4. 3 硬件驱动程序设计 ............................................................................................ 45
§4.3.1 语音识别系统 CMD 文件 ........................................................................ 45
§4.3.2 Flash 引导装载 .......................................................................................... 46
§4.4 语音识别系统软件设计 ..................................................................................... 47
§4.5 本章小结 ............................................................................................................. 50
第五章 实验结果及性能分析 ........................................................................................... 51
§5.1 语音库的建立 ..................................................................................................... 51
§5.2 基于 Matlab 语音识别系统的实验结果及分析................................................ 51
§5.3 语音识别系统在 DSP 的实现及分析................................................................ 55
§5.4 本章小结 ............................................................................................................. 56
第六章 总结与展望 ........................................................................................................... 57
§6.1 总 结 ................................................................................................................... 57
§6.2 展 望 ................................................................................................................... 57
参考文献 ............................................................................................................................. 58
致 谢 ................................................................................................................................... 61
作者在攻读硕士期间主要研究成果 ................................................................................. 62
第一章 绪论
1
第一章 绪论
§1.1 选题背景及意义
语音是人类使用最为广泛的一种信息交换途径。利用语音方式与机器进行交流,
并且让机器“听懂”人在说什么,这一直是人们盼望已久的事情。语音识别
[1][2]
(speech
recognition,简称 SR)技术就是把人类的语音内容转换成能够被机器理解、识别并作
出相应反应的技术。随着科学技术的高速发展,人们对机器的要求也越来越高,如何
使机器更加智能化、更加人性化的问题得到人们广泛的关注,而语音识别技术能够有
效的解决这方面的难题而成为许多学者研究的热点方向。汽车已经成为人们最便捷也
是最重要的交通工具,因此对智能驾驶的语音识别技术的研究具有非常重大的现实意
义和非常好的发展前景。
对语音识别技术的不断深入研究,逐渐从理论分析变成实际产品,从实验室走向
市场。语音识别技术是一门覆盖性较广的边缘学科,它覆盖了语音信号处理、人工智
能、密码学和信息处理等领域,在电子工业、汽车、医学器械、家庭服务等领域有着
非常广泛的应用。然而语音识别是一项涉及领域比较广而且难度特别大以及科技含量
非常高的项目,一直存在许多非常难解决的问题。目前,国内外往语音识别研究领域
投入了大量的人力和财力,极大促进了该技术的发展和应用,它正处于黄金发展时期。
目前对智能驾驶的语音识别系统的研究非常少,在 DSP 上对其研究和实现则更
少。一方面是车内的噪声对识别系统的影响特别大,如何增强语音信号的抗噪性是一
个比较难解决的问题;另一方面采用什么样的识别算法能够更好的提高系统的识别
率。现在比较成熟的识别算法有隐马尔可夫(HMM)算法、VQ 算法
[3]
、人工神经网络
(ANN)算法等,它们在语音识别系统中能获得非常好的识别效果,但是也存在着本身
的局限性。HMM 虽然有比较强的抗干扰性和较高的识别率,但是需要对大量的数据
进行训练和建立庞大的数据库,计算量非常大而且占据较大的存储空间。ANN 算法
具有非常强的自学能力和自组织能力以及很强的顽健性,但是其计算过程过于复杂,
计算量也非常的庞大,该算法在硬件上运行的速度比较慢,不利于语音识别的实时性。
SVM (支持向量机)在处理小样本、非线性、高维数等实际问题中有很多独特的优点,
如在语音识别、说话人识别等领域中表现出良好的性能,而且具有非常出色的学习能
力。由于语音是随机非平稳、长短不一的信号,但是 SVM 只能处理相等长度的向量,
而 DTW(动态规划)算法能有效的解决语音信号长短不一的问题并且其计算过程比较
简单。故本文将使用 SVM 和 DTW 相结合的方法来作为识别系统的识别算法。
基于 DSP 智能驾驶的语音识别系统研究
2
§1.2 语音识别系统的研究现状
对语音信号处理技术的研究已经有相当长的历史,而对语音识别技术领域的研究
工作比较晚,真正对其进行研究最早是在 20 世纪 50 年代。1952 年,Bell 实验室成
功研发出了基于特定人、孤立词的语音识别系统,也被成为 Audry 系统,该系统成功
的识别出十个英文数字的发音。1956 年,RCA 实验室利用元音部分的谱测量作为语
音信号的特征参数,成功的开发出了 10 个单音节的语音识别系统。1959 年,美国麻
省理工学院林肯实验室利用声道的时变估计技术成功实现了 10 个元音的识别。
到了 20 世纪 60 年代,RCA 实验室设计了时间归正技术有效解决了语音信号长
短不一的问题,使语音识别性能得到明显的改进。斯坦福大学的 Reddy 教授开始对连
续语音识别进行研究,取得了重大的突破,极大的推动了连续语音识别的发展。
进入 20 世纪 70 年代,对语音识别的研究得到突破性的发展。DTW(动态规划)
算法成功应用到小词汇量、孤立词语音识别系统中,基于语音编码中常用的 LPC (线
性预测编码)的倒谱参数 LPCC
[4][5]
也被成功运用在语音识别中。这时期,VQ(矢量化)
码本生成问题得到解决,而且成功的把 VQ 技术应用到了语音识别中。
到了 20 世纪 80 年代,语音识别技术的研究又向前迈进了一大步。HMM(隐马尔
可夫)算法的出现,并把该算法应用到语音识别系统,使系统的性能得到非常大的改
善。美国的卡内基.梅隆大学首个开发出的 SPHINX 系统,它是基于非特定人、大词
汇量、连续语音识别系统
[6]
,被认为是语音识别领域一个伟大成就。除此之外,BBN
利用语音因素开发的 BYBLOS 系统和林肯研究室设计的语音识别系统都具有良好的
性能。这些研究极大的促进了语音识别技术的发展。
进入 20 世纪 90 年代,ANN(人工神经网络)成为学者们研究的热点,并把该技术
运用到了语音识别系统中。语音识别技术经过不断的改进和完善,开始从实验室走向
市场。许多知名大公司如 Apple、IBM、微软等都投入大量的人力财力对语音识别系
统的实用化进行研究开发。他们相继推出了自己的研究产品,如 Sun 的 VoiceTone、
Microsoft 的 Whisper、IBM 的 ViaVoice 系统等。
进入 21 世纪,随着嵌入式语音信号处理技术的高速发展。许多公司已经推出了
一些性能非常好的语音识别芯片,比如飞利浦公司的 Hello IC 以及 Unilite 等语音识
别芯片在嵌入式硬件设计中有着非常重要的应用。在语音识别系统软件方面则有 IBM
的 Via Vioce 以及微软的 SAPI 等。
现在,语音识别技术已经在许多领域得到了广泛的应用。例如 Apple 手机的 Siri
和美国航空公司使用的语音识别系统等。这些产品的出现一方面表明语音识别技术具
有非常好的发展前景,另一方面将会进一步推动语音识别技术的研究。
我国对语音识别领域的研究比国外晚很多,最早对该技术进行研究的是 20 世纪
剩余64页未读,继续阅读
资源评论
programhh
- 粉丝: 8
- 资源: 3838
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功