论文研究-基于嵌入式的语音识别研究 .pdf

所需积分/C币:10 2019-08-14 16:10:39 374KB .PDF
收藏 收藏
举报

基于嵌入式的语音识别研究,王生银,李东新,语音识别技术就是让计算机
国武技论文在线 http:/www.paper.edu.cn 就可以把人们当前输入的语音在语音库中查找相应的词义语义。从信号处理的角度,任何 个语音识别系统都能以图1-2米表示。 输入 预处理 识 识别结果 特征提取 相似性度量 模顿配颜 后处理 语音 别 练 金考模式 75 图1-2语音识别系统 如上图所示,语音识别主要包括语音信号的预处理、特征提取、参考模式斥、相似性度 量和后处玛等几个模块。各个模块的功能说明如下。 预处理模块,对输入的原始语音信号进行处理,滤除其中的不重要的信息及背景噪音等, 80进行语音信号的端点检测,即判定语音有效范围的始点和终点位置,并进行语音分帧以及预 加重等处珂工作 特征提取模块,负责计算语音的声学参数,进行特征的计算,取出反映信号特征的关键 特征参数,以降低维数,便于后续处理。话音识别系统常用的特征参数有幅度,能量,过零 率,线性预测系数(LPC)、LPC倒谱系数(LPCC)、线谱对参数(LSP)、短时频谱 85共振峰频率、反映听觉特征的Ml频谱倒谱系数(MF℃℃)等。特征选择和提取是枃建系统 的关键。 在训练阶段,用户输入岧次训练语音,系统经过预处理和特征提取得到特征矢量参数 序列),然后通过特征建模模块建立训练语音的参考模式库。 在识别阶段,将输入语音的特征矢量参数和参考模板库中的模式进行相似性度量比较, 90将相似度最高的模式所属的类别作为识别中间侯选结果输出 后处珥模块,是对上述得到的候选识别结果继续处理,通过更多的识别约束,得到最终 结果 语音识别模型 三语音识别基本原理是对语音信号进行特征提取。目前常用的语音识别算法有基于模式 95匹配的动态时间规整法(DTW: Dynamic Timc Warping),基于统计模型DSP的隐马尔可 夫模型法(HMM: Hidden markov model)以及基于人工神绎网络识别法(ANN)等 动态时间规整( 语音识别中,不能简单地将输入模板直接比较,因为语音信号具有相当大的随机性,即 使同一个人,在不同时刻的同一句话发的同一个音,也不可能具有完全相同的时间长度,因 l00此时间规整必不可少。DW是时间规整与距离测庋结合的非线性规整技术。假设参考模板 特征矢量序列为a1,a2,…,am,…,aM;输入语音特征矢量序列为b1,b2,…,bn,…, bN,M≠N,那么动态时间规整是要寻找时间规整函数m-ω(n),它把输入模板的时间轴n 非线性地映到参考模板的时间轴m,且ω满足d[n,o(n)为最小矢量距离。其中,d[n,o(n) 是第n帧输入矢量和第m帧参考矢量的距离,D是相应于最优时间规整下一个模板的距离 国武技论文在线 http:/www.paper.edu.cn 105测度。DTW是个典型的最优化问题,它用满足‘定条件的吋闩规整函数ω(n)描述输入模 板和参考模板的时间对应关系,求解两模板匹配时的累计距离最小所对应的规整函数。 DTIW算法通过将待识语音信号的时间轴进行不均匀的扭曲和弯曲,使其特征与模板特 征对齐,并在两者之间不断的进行两个矢量最小的匹配路径计算,从而获得两个矢量匹配时 累计距离最小的归整函数。这是一个将时间归整和距离测度有机结合在一起的非线性归整技 110术,保证了待识别特征与模板特征之间最大的声学相似特征和最小的时差失真,是成功解决 匹配问题的最早、最常用的方法。图2-3是棊于DTW算法语音识别的技术路线图 短时参数提取 训参考模板 预 语音输入处 理 量量化 模式识别识别结果 图2-3DIW算法语音识别技术 基于 的语音识别系统硬件平台的设计 硬件总体设计方案 本课题设计的语音识别系统的 Linux平台用 Samsung公司的高性能S3C244ARM处理 器作硬件开发平台的核心,围绕它搭建外围电路,选择所需要的外围电跻芯片。其外围硬件 主要包括:64 MSDRAM,64 MNand flash,CS8900A以太网控制器,一个总线扩展接口, 120两个串口输出, Philips公司的UDA1341TS音频数字信号编译码器,一个MIC输入接口, 个LINE音频输入接口,一个耳机输出接口,JAG调试接口,ⅴGA接口(可直接连接普 通PC显示器)和IDE接口(可直接连接硬盘)等。硬件平台功能模块如图31所示。 国武技论文在线 http:/www.paper.edu.cn Nand Flash+ 麦克风4 音处理芯片 ARM+ PC机 S3C2410 扬声器 SDRAM+ 图3-1硬件平台模块 125 主要由UDA134S,s3c2440和键盘组成。系统的控制和识别工作由语音信号的特征提 取和训练算法全部由由UDA134IS米完成。键盘则用米控制整个系统的工作状态选择,用 按键选择不同的功能。S3C2440与UDAI34IIS的通信通过HS音频总线方式完成,主机通 信则由S3C2440通过其异步串口UART实现,并操作显示器显示信息 130 基于 的 语音识别系统的定制研究 建立目标板 Linux系统有4个步骤:决定系统组件;配置及建立内核;建立根文件系 统;设置引导软件与配置。为开发方便,主机安装虚拟机Ⅴ Mware,虚拟机上安装上 dora core 8,文的编译工作在FC8上完成的。首先准备 Fedora832位ISO镜像安装文作(DVD或CD 版均可,本文采用的DVD版本),和 VMWarc Workstation6.02。与上流软件开发相似,嵌入式 135系统开发也需要编译器、链接器、解释程序、集成开发环境以及其他开发工具。 交叉开发概念模型 嵌入式系统是专用计算杋系统,由于其硬件的特殊性,不能安装发行版的Liux系统。 例如:由于 Flash存储空间很小,没有足够的安装空间;或者处理器很特殊,没有发行版的 Iinuκ系统可用。所以需要专门为特定目标板定制 Linux捰作系统,这必然需要相应的开发 140环境。这套环境包括操作系统以及含连接器、编译器、调试器在内的软件开发工具 嵌入式 Linux开发,一般在开发主机(HOST)上安装开发工具,编辑、编译目标板的 Lin引导程序、内核和文件系统等,然后在日标板( TARGET)上运行。通常将这种在主 杋环境下开发,在日标板上运行的开发模式叫作交叉开发,其模型如图41所示。 国武技论文在线 http:/www.paper.edu.cn HOST 各种连接方式 TARGET 下载内核文件 内核映象 根文件系统 内核映象 挂载根文件系统 145 图4-1交叉开发模型 对于交叉开发方式,一方面开发者可以在熟悉的主机环境下进行程序开发;另一方面又 可以真实地在日标板系统上运行调试程序,避免受到目标板使件的限制。这种开发方式贯穿 」[inux系统廾发的全过程。建立交叉廾发方式,需要主机与目标板冋建立连接。这依赖」 150不同的连接方式,如可以使用串凵、以太网接山、USB接凵以及JAG接凵等连接方式。 分析及移植 嵌入式系统的引导代码( Bootlaoder)是系统加电后运行的一段程序。在系统启动时运行 非常短的时间,但对于嵌入式系统是一个非常重要的组成部分。通过这段程序,使硬件设备 初始化,创建内核需要的信息并将这些信息传递给內核,从而将系统的软埂件环境带到一个 155合适的状态,最终调用操作系统内核,真正起到引导和加载内核的作用。Bω unloader是依赖 于硬件而实现的,特别是在嵌入式系统中。不同的体系结构需求的 Bootloader是不同的。 总结 本文主要给出了语音识别整个流程所需要的关键理论基础,语音信号的前期加窗函数处 理,语音特征提取 160 υ介绍了语音的产生模型,以及识别算法的介绍。主要内容包括:声道模型和激劢模型。 语音信号的端点检测方法,短时平均过零率和短时平均能量方法,木文在后面识别时主要是 用到这两种端点检测相结合的方法。 2)用DTW方法实现了孤立词的识别,特征提取分别用到了LPc,LPc,MFCC方法 识别结果比较满意。不足是没有进行大词汇量的识别 165 3)探讨了HMM方法的理论基础,HMM方法是将来语音识别的主流方向,无论是大词 汇量还是连续语音识别,都会用到HMM方法,因此这里重点介绍。 4)介绍基于ARM和 Linux平台夕介绍了如何搭建一个完整的嵌入式语音平台 参考文献 1] LAWRENCE RABINER, BING HWANG, JUANG,语音识别基本原理英文M北京:清华大学出版社, 1701999 [2] YiXu. Effects of tone and Focus on the formation and alignment of Focontours, journal of PhonetsJ1, 1999(7): 55-59 3I S3C2440A 32-BIT RISC MICROPROCESSOR USERS MANUAL, 2004, 7 [4]www.bigfoot.com/-jialongHe 175 [5] Wilpin J, Rabincr L R, Lcc C H, cal. Automatic recogition of kcywords in unconstrained spccch using hidden Markov models, IEEE Trans on ASSP, 1992,38(11): 1870-1990

...展开详情
试读 6P 论文研究-基于嵌入式的语音识别研究 .pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    • 至尊王者

      成功上传501个资源即可获取
    关注 私信 TA的资源
    上传资源赚积分,得勋章
    最新推荐
    论文研究-基于嵌入式的语音识别研究 .pdf 10积分/C币 立即下载
    1/6
    论文研究-基于嵌入式的语音识别研究 .pdf第1页
    论文研究-基于嵌入式的语音识别研究 .pdf第2页

    试读已结束,剩余4页未读...

    10积分/C币 立即下载 >