人工智能-语音识别-基于DSP智能驾驶的语音识别系统研究.pdf资源-CSDN文库

版权申诉

173 浏览量 2022-06-28 00:29:49 上传评论收藏 1.81MB PDF 举报

资源推荐

资源详情

资源评论

Abstract

In recent years, research on speech recognition technology is very active, and it’s

theory and implementation has made a major breakthrough. Using speech recognition

technology products are more and more, and coverage is quite extensive, such as in the use

of electronic communications systems, military, transportation, industrial, medical and so

on. Speech recognition technology has become a challenge for high and new-tech industry

is highly competitive, which inspired the strong interest of researchers and in-depth

research on the technology.

In this paper, the basic theory of speech recognition technology and its research status

at home and abroad are analyzed , proposed an improved speech recognition algorithm,

and the algorithm as the core to establish a speech recognition system, and finally in

Matlab and TMS320C6713DSK platform respectively simulation and experimental

validation of the system .

Speech recognition system of core algorithms mainly consists of pre-emphasis and

sub-frame window of pre-processing, the endpoint detection, feature parameters of the

calculation, DTW (dynamic time bending) algorithm, the improved DTW algorithm, SVM

(support vector machine), grid search parameter optimization and genetic parameter

optimization algorithm and improved DTW/SVM algorithm. In this paper, on the first of

these algorithms in Matlab platform simulation, and then the corresponding C code and

assembly code to write on CCS software platform and debug, and ultimately burns wrote

to DSK6713 on the development and application board of validated speech recognition

system is implemented at the hardware development. DSK6713 and TLV320AIC23 voice

capture chip as the entire hardware core, set to system initialization, the speech signal

acquisition and training, implementation the core speech recognition algorithm, display the

recognition result and other functions.

Finally, analysis of the experimental results and the performance of the system in

Matlab and DSK6713 platform, and summarize subject all the work, pointed out the

direction of future research topics and improvement.

Key Words: Speech Recognition；MFCC；DTW；SVM；DSP

III

摘要 ......................................................................................................................................I

Abstract..................................................................................................................................II

第一章绪论 ......................................................................................................................... 1

§1.1 选题背景及意义 ................................................................................................... 1

§1.2 语音识别系统的研究现状 ................................................................................... 2

§1.3 语音识别技术目前遇到的问题 ........................................................................... 3

§1.4 本文的主要工作安排 ........................................................................................... 3

第二章语音信号的前端处理和特征提取 ......................................................................... 5

§2.1 语音信号的数学模型 ........................................................................................... 5

§2.2 语音信号的前端处理 ........................................................................................... 6

§2.2.1 预处理 .......................................................................................................... 6

§2.2.2 端点检测 ..................................................................................................... 8

§2.3 特征参数提取 ..................................................................................................... 12

§2.3.1 LPCC 参数 ................................................................................................. 12

§2.3.2 MFCC 参数................................................................................................ 14

§2.4 本章小结 ............................................................................................................. 16

第三章语音识别算法及 Matlab 仿真分析...................................................................... 17

§3.1 DTW 算法及其在 Matlab 的实现....................................................................... 18

§3.1.1 DTW 算法.................................................................................................. 18

§3.1.2 DTW 算法在 Matlab 的实现..................................................................... 20

§3.2 改进的 DTW 算法.............................................................................................. 21

§3.3 支持向量机 ......................................................................................................... 23

§3.3.1 统计学理论的主要内容 ........................................................................... 23

§3.3.2 最优分类面 ............................................................................................... 25

§3.3.3 SVM 核函数 .............................................................................................. 27

§3.3.4 多类分类 SVM ......................................................................................... 28

§3.4 基于 Libsvm 对 SVM 最佳参数寻优及实验分析 ............................................ 29

§3.4.1 Libsvm 工具箱 ........................................................................................... 29

§3.4.2 网格搜索算法 ........................................................................................... 31

§3.4.3 GA 遗传算法 ............................................................................................. 32

§3.5 DTW 算法与 SVM 算法的结合 ......................................................................... 35

§3.6 本章小结 ............................................................................................................. 36

第四章语音识别算法在 DSP 上的实现.......................................................................... 37

§4.1 TMS320C6713 DSK 简介 ................................................................................... 37

§4.2 识别系统的硬件结构 ......................................................................................... 38

§4.2.1 语音数据采集模块 ................................................................................... 38

§4.2.2 数据传输模块 ........................................................................................... 41

§4.2.3 存储器模块 ............................................................................................... 43

§4.2.4 电源模块和其他模块 ............................................................................... 44

§4. 3 硬件驱动程序设计 ............................................................................................ 45

§4.3.1 语音识别系统 CMD 文件 ........................................................................ 45

§4.3.2 Flash 引导装载 .......................................................................................... 46

§4.4 语音识别系统软件设计 ..................................................................................... 47

§4.5 本章小结 ............................................................................................................. 50

第五章实验结果及性能分析 ........................................................................................... 51

§5.1 语音库的建立 ..................................................................................................... 51

§5.2 基于 Matlab 语音识别系统的实验结果及分析................................................ 51

§5.3 语音识别系统在 DSP 的实现及分析................................................................ 55

§5.4 本章小结 ............................................................................................................. 56

第六章总结与展望 ........................................................................................................... 57

§6.1 总结 ................................................................................................................... 57

§6.2 展望 ................................................................................................................... 57

参考文献 ............................................................................................................................. 58

致谢 ................................................................................................................................... 61

作者在攻读硕士期间主要研究成果 ................................................................................. 62

第一章绪论

§1.1 选题背景及意义

语音是人类使用最为广泛的一种信息交换途径。利用语音方式与机器进行交流，

并且让机器“听懂”人在说什么，这一直是人们盼望已久的事情。语音识别

[1][2]

(speech

recognition，简称 SR)技术就是把人类的语音内容转换成能够被机器理解、识别并作

出相应反应的技术。随着科学技术的高速发展，人们对机器的要求也越来越高，如何

使机器更加智能化、更加人性化的问题得到人们广泛的关注，而语音识别技术能够有

效的解决这方面的难题而成为许多学者研究的热点方向。汽车已经成为人们最便捷也

是最重要的交通工具，因此对智能驾驶的语音识别技术的研究具有非常重大的现实意

义和非常好的发展前景。

对语音识别技术的不断深入研究，逐渐从理论分析变成实际产品，从实验室走向

市场。语音识别技术是一门覆盖性较广的边缘学科，它覆盖了语音信号处理、人工智

能、密码学和信息处理等领域，在电子工业、汽车、医学器械、家庭服务等领域有着

非常广泛的应用。然而语音识别是一项涉及领域比较广而且难度特别大以及科技含量

非常高的项目，一直存在许多非常难解决的问题。目前，国内外往语音识别研究领域

投入了大量的人力和财力，极大促进了该技术的发展和应用，它正处于黄金发展时期。

目前对智能驾驶的语音识别系统的研究非常少，在 DSP 上对其研究和实现则更

少。一方面是车内的噪声对识别系统的影响特别大，如何增强语音信号的抗噪性是一

个比较难解决的问题；另一方面采用什么样的识别算法能够更好的提高系统的识别

率。现在比较成熟的识别算法有隐马尔可夫(HMM)算法、VQ 算法

[3]

、人工神经网络

(ANN)算法等，它们在语音识别系统中能获得非常好的识别效果，但是也存在着本身

的局限性。HMM 虽然有比较强的抗干扰性和较高的识别率，但是需要对大量的数据

进行训练和建立庞大的数据库，计算量非常大而且占据较大的存储空间。ANN 算法

具有非常强的自学能力和自组织能力以及很强的顽健性，但是其计算过程过于复杂，

计算量也非常的庞大，该算法在硬件上运行的速度比较慢，不利于语音识别的实时性。

SVM (支持向量机)在处理小样本、非线性、高维数等实际问题中有很多独特的优点，

如在语音识别、说话人识别等领域中表现出良好的性能，而且具有非常出色的学习能

力。由于语音是随机非平稳、长短不一的信号，但是 SVM 只能处理相等长度的向量，

而 DTW(动态规划)算法能有效的解决语音信号长短不一的问题并且其计算过程比较

简单。故本文将使用 SVM 和 DTW 相结合的方法来作为识别系统的识别算法。

基于 DSP 智能驾驶的语音识别系统研究

§1.2 语音识别系统的研究现状

对语音信号处理技术的研究已经有相当长的历史，而对语音识别技术领域的研究

工作比较晚，真正对其进行研究最早是在 20 世纪 50 年代。1952 年，Bell 实验室成

功研发出了基于特定人、孤立词的语音识别系统，也被成为 Audry 系统，该系统成功

的识别出十个英文数字的发音。1956 年，RCA 实验室利用元音部分的谱测量作为语

音信号的特征参数，成功的开发出了 10 个单音节的语音识别系统。1959 年，美国麻

省理工学院林肯实验室利用声道的时变估计技术成功实现了 10 个元音的识别。

到了 20 世纪 60 年代，RCA 实验室设计了时间归正技术有效解决了语音信号长

短不一的问题，使语音识别性能得到明显的改进。斯坦福大学的 Reddy 教授开始对连

续语音识别进行研究，取得了重大的突破，极大的推动了连续语音识别的发展。

进入 20 世纪 70 年代，对语音识别的研究得到突破性的发展。DTW(动态规划)

算法成功应用到小词汇量、孤立词语音识别系统中，基于语音编码中常用的 LPC (线

性预测编码)的倒谱参数 LPCC

[4][5]

也被成功运用在语音识别中。这时期，VQ(矢量化)

码本生成问题得到解决，而且成功的把 VQ 技术应用到了语音识别中。

到了 20 世纪 80 年代，语音识别技术的研究又向前迈进了一大步。HMM(隐马尔

可夫)算法的出现，并把该算法应用到语音识别系统，使系统的性能得到非常大的改

善。美国的卡内基.梅隆大学首个开发出的 SPHINX 系统，它是基于非特定人、大词

汇量、连续语音识别系统

[6]

，被认为是语音识别领域一个伟大成就。除此之外，BBN

利用语音因素开发的 BYBLOS 系统和林肯研究室设计的语音识别系统都具有良好的

性能。这些研究极大的促进了语音识别技术的发展。

进入 20 世纪 90 年代，ANN(人工神经网络)成为学者们研究的热点，并把该技术

运用到了语音识别系统中。语音识别技术经过不断的改进和完善，开始从实验室走向

市场。许多知名大公司如 Apple、IBM、微软等都投入大量的人力财力对语音识别系

统的实用化进行研究开发。他们相继推出了自己的研究产品，如 Sun 的 VoiceTone、

Microsoft 的 Whisper、IBM 的 ViaVoice 系统等。

进入 21 世纪，随着嵌入式语音信号处理技术的高速发展。许多公司已经推出了

一些性能非常好的语音识别芯片，比如飞利浦公司的 Hello IC 以及 Unilite 等语音识

别芯片在嵌入式硬件设计中有着非常重要的应用。在语音识别系统软件方面则有 IBM

的 Via Vioce 以及微软的 SAPI 等。

现在，语音识别技术已经在许多领域得到了广泛的应用。例如 Apple 手机的 Siri

和美国航空公司使用的语音识别系统等。这些产品的出现一方面表明语音识别技术具

有非常好的发展前景，另一方面将会进一步推动语音识别技术的研究。

我国对语音识别领域的研究比国外晚很多，最早对该技术进行研究的是 20 世纪

剩余64页未读，继续阅读

评论收藏

内容反馈

版权申诉

programhh

粉丝: 8
资源: 3838

人工智能-语音识别-基于DSP智能驾驶的语音识别系统研究.pdf

基于人工智能的语音识别系统及应用研究.pdf

基于DSP的语音识别系统及其结构.pdf

DSP中的基于DSP开发板的语音识别系统的研究（一）

基于深度学习的语音识别系统研究.pdf

人工智能-语音识别-基于DSP的非特定人孤立词语音识别系统的研究.pdf

人工智能-语音识别-基于SVMDTW算法的语音识别研究及其DSP实现.pdf

基于dsp的语音信号采集与回放系统的设计--开题报告.docx

基于DSP语音识别课程设计 - 杨艳珍.docx

DSP中的基于DSP开发板的语音识别系统的研究（二）

基于SPCE061A的智能语音识别系统设计.pdf

人工智能-语音识别-基于多特征参数混合语音识别系统研究与实现.pdf

智能语音识别系统噪声鲁棒性研究.pdf

基于深度学习的不规范驾驶行为智能识别系统.pdf

人工智能-图像处理-基于DSP的视觉假体图像处理与识别技术研究.pdf

人工智能-图像处理-基于ARM和DSP的嵌入式实时图像处理系统设计与研究.pdf

人工智能-图像处理-基于DSP的通用实时图像处理系统设计与研究.pdf

人工智能-图像处理-基于FPGA和DSP的图像处理技术研究.pdf

一种基于DSP的汉字语音识别系统设计.pdf

基于长短时记忆元的语音智能识别系统设计.pdf

基于深度神经网络的语音识别系统研究.pdf

大数据-算法-抗噪语音识别算法的DSP实现.pdf

人工智能-图像处理-基于DSP的图像处理系统的设计.pdf

人工智能-目标检测-基于DSP的运动目标检测系统的实现.pdf

毕业设计_基于DSP的语音信号处理系统设计.pdf

基于dsp的语音识别系统

基于DSP的指纹识别系统.pdf

人工智人-家居设计-基于DSP的多功能信息采集与智能监控系统的研究.pdf

最新资源