论文研究-基于小波降噪的时延估计研究 .pdf

所需积分/C币:15 2019-08-15 17:31:04 326KB .PDF
收藏 收藏
举报

基于小波降噪的时延估计研究,张明瀚,石为人,时延估计是阵列信号处理中的一项关键技术。针对室内视频监控系统对声源定位技术的需求,本文对广义互相关算法中基本互相关、互功
山国科技论义在线 http://www.paper.edu.cn 权函数 Φ(c) 为广义互相关谱,这样到达时延为 乙a= arg m X((z) 根据式(3)选取不同的权函数12(O)就可得出不同的估计时延算法。它的选取可根据 实际的声学环境选择相应的准则,使得(口)有个比较尖锐的峰值,待到最好的估计效果, ()峰值为两传声器间的时延。文献对加权2()的选取主要有表1所示: 表1加权函数表 加杈 表达式 (基本互相关) PHAT (互功率谱相位) 1/n2() ROTH处理器 1( SCOT (平滑相干变换) 1/n(@)2(@) 基于算法的时延估计系统结构图 GCC方法的基木思想如图3所示: Microphe A/D 利用FIR滤除 利用FIR滤除 300H2--6K Hz 300Hz-6K H2 之外的信号 之外的信号 乘以加双 1级能 量检测 量检 2级过 率检测 检测 卜一桢1< signal? (r) signal 点汉明窗 点汉明窗分 峰值检测 (1) ( 图3基于GCC算法时延估计系统流程图 图中[ 为语音段信号2傅氏变换后的共扼函数。412为求得的两传声器接收同 源信号传输时间的时间差。 山国科技论义在线 http://www.paper.edu.cn 为了改善吋延估计系统的性能,本文首先对呆集进来的每帧信号进行滤波,因为大部分 噪音属于低频段,而声音信号主要集中在300Hz~6KHz的区间,故先对采集进来的声音信 号进行FIR滤波,滤除300z~6KIz以外的信号;其次,针对在本系统中声音信号是随机 性的出现,一般情况下所处环境长时间没有声音,因此对所采集的信号无需每次都进行相关 性分析,所以对滤波后的信号进行有无声音检测的预处理,有声音信号则进一步进行分析, 无则丢掉当前帧信号而进入下一帧。通过声音信号的检测,只在有语音段进行时延估计既能 减少系统的运算量,还能有效地避免静音段由于噪声引起的干扰,提高估计的性能。 本系统采用短时能量和过零率来区分语音段和噪声段。首先采用短时能量法对声音 信号进行检测,此方法是基」传声器采集到的语音段能量要大于噪声段能量的原理来实现。 然而语音的起始部分往往存在能量很低的清辅音,因此不能仪仪依靠短时能量为依据而确定 语音信号的起始点,而往往语音的起始点是我们最关心的。因此我们再利用清音段过零率高 于静音段的特点,利用过零率来判断语音信号的起点。对于语音的终点,利用短时能量先找 到近似点,再利用过零率来确定终止点。 确定了语音段后,利用加窗平均周期图法来求得两个传声器间的互功率谱(O),通 过选择不同的加权的数12(d)来求得相应的广义互相关谱①() ,再利用傅氏反变换求 得其互相关函数,进而求得佔计时延22 实验仿真 实验环境 本系统仿真环境为7x8×2.8的矩形房屋,语音信号山两个麦克风传声器通过 PC机录音口的左右声道对声源进行实时采样,两传声器之间相距80cm,采样频率为 Fs=16KHz,采样位数为16bt,房屋混响为50ms,采用半重叠512点汉宁窗,V12()加权 采用如表1所指,实验中的声音信号为尖叫、拍巴掌等异常声音所得,由于本系统主要是为 了定位,不需了解声音信息具体所指內容,基于我们关心的只是声音信号刚刚到来的信息, 所以为了减小混响的影响,对检测出来的语音信号只取前面2048个采样点进行分析。 实验结果 对采集进来的信号首先进行预处理,滤除300Hz~6KHz以外的信号,再将语音信号从 每帧中提取出来,由图4可以看出其滤波与提取所做的显著效果 山国科技论义在线 http://www.paper.edu.cn 通道输入信号 通道输入信号 通道滤波后信号 通道滤波后信号 通道短时能量过零检测 通道短时能量江零率检测 图4语音信号的滤波以及提取 接着再从中提取一组检测到的声音信号分别做不同信噪比SNR卜的相关性分析,如图 (5~7)所示 通道信号 法求互相关 法局部放大 通道信号 法求互相关 法局部放大 法求互甜关 法局部放大 法求互相关 法局部放大 互功率谱函数 图5信噪比SNR=10DB 由图5我们可以看出,通道1与通道2的真实延迟为-20个采样点。当SNR=10DB时, 四种方法测得最大值位置与实际结果非常吻合,而且最大值尖锐程度非常突出。 山国科技论义在线 http://www.paper.edu.cn 法求互相关 法求互相关 法求互相关 法求互相 图6信噪比SNR0DB 法求互相关 法求互相美 法求互相 法求互相关 图7信噪比SNR=-5DB 图6中,当SNR-=0DB时,CC加权结果最大值已经被淹没在噪声之中,ROTH加权结 果有很大干扰存在,其它两种加杈结果能够准确估计时延,除CC法外其它三种加权结果峰 值尖锐程度减弱;图7中,当SNR=5DB时,峰值尖锐程度进一步恶化,CC加权与ROTI 加权结果中所需的最大值已经完全淹没在噪声中,PHAT加杈结果基夲能够识別岀来,但峰 值尖锐程度已经不明显,SCOT算法最好,仍然能比较准确的分析岀时延,但峰值尖锐稈度 下降很快。对于以上四种方法,分别在不同信噪比下各进行100次仿真,测得如下表2所示 结果 表2不同加权函数在不同信噪比下各白进行100次仿真 加权函数 CC PHAT ROTH SCOT 准确率 准确率 准确率 SNRDB 准确率 10 25% 95% 96% 96% 0 不可用 85% 90% 不可用 62 不可用 68% 山国科技论义在线 http://www.paper.edu.cn 性能分析 由表2可以得出,在较低混响条件下,CC、PHAT、Roth处理器以及SCOT四种加权 方式的互相关函数峰值的尖锐程度随信噪比的降低而降低,时延估计的准确性随着信噪比的 下降而恶化,其中SCOT和PHAT加权效果相对于另外二种加权来说,性能恶化的速度较 慢,抗噪性能较好。主要原因是SCOT和PHAT加权函数同时考虑了两个通道的影响,从 而提高了抗噪性能。然而除了算法本身的原因之外,由系统馊件造成的影响也不可忽略,总 结主要有两个原因:一是信号采集是通过 Windows录音口来米集,所以由PC主机电源风扇 和CPU风扇引起的信源噪声污染不可忽略,而且 Windwos采集卡不方使调零;二是传声器 采用的是两个普通的麦克风,信噪比不同,也没有调零功能,由比造成的影响最大。基于这 两个信号采集问题,从而造成信号之间的相关性变差,进一步导致算法性能下降很快。鉴于 本系统面对的环境信噪比为ODB以上,由仿真结果可知采用SCOT佔计算法可以满足系统 的需求。 结论 对于实际的定位系统而言,稳健的时延估计将为下一步精确的空间定位奠定坚实的基 础。本文对室内声源通过GCC算法求出比较准确的时间差,满足了当前系统的需求,但这 是建立在房间噪声和混响相对较小的情况而言,而对于房间噪声和混响相对严車的情况,结 果很不理想,因此在下一步工作中,通过软哽件各方面的改进,进一步着力研究在强噪声与 强混响条件下的声源定位。 7 山国科技论义在线 http://www.paper.edu.cn 参考文献 l]郭俊成;基于传声器阵列的声源定位技术研究[D:南京航空航天大学;207年 [2]王水良陈辉,彭应宁等空间谱估计理论与算江[M]清华大学出版社,2004 [3 Knapp C h, Carter G C. The generalized correlation method for estimation of time delay [ IEEE Transactions on Acoustics, Speech and Signal Processing, 1976, 24(4): 320-327 [4J B.Allen, D.A. Berkley, Image method for efficiently simulating small room acoustics, Journal of Acoustical Society of America, 1979, 65(4): 943-950 [5 Carter GC, NuttallA H, Cable P G. The smoothed coherence transform (SCOT[]. Proceedings of IEEe, 1973.61:1497-1498 [6]张薤伟.现代语音处理技术及应用[M,机械工业出版社,2003 [7]居太亮彭启琮等基丁任意麦克风阵列的声源二维DOA估计算法研究通信学报2005(8):129-133 Minghan Zhang, Weiren Shi College of Automation, Chong Qing university, Chongqing, (400044) Time delay of arrival (TDoA) is one of the key techniques in array signal process. In view of the requirement of sound source localization in video monitor system we compare anti-reverberation and anti-noise capability among cross correlation(CC) phase transform(PHAT), Roth processor and smooth coherent transform(SCOT) weighting functions which belong to generalized cross correlation algorithm, the SCOt weighting function method greatly meets the demand of sound source localization in anti-noise capability of the video monitor system sound source localization cross correlation time delay estimation 作者简介 石为人(1948-),男,重庆人,教授,博士生导师,主要研究方向:智能系统、智能感知 与自组织网终、无线传感器网络、嵌入式系统、网终环境下的智能自动化技术、移动机器人 控制; 张明瀚(1981-),男,甘肃人,硕士研究生,矿究方向:数字信号处理,嵌入式系统

...展开详情
试读 8P 论文研究-基于小波降噪的时延估计研究 .pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    上传资源赚积分,得勋章
    最新推荐
    论文研究-基于小波降噪的时延估计研究 .pdf 15积分/C币 立即下载
    1/8
    论文研究-基于小波降噪的时延估计研究 .pdf第1页
    论文研究-基于小波降噪的时延估计研究 .pdf第2页
    论文研究-基于小波降噪的时延估计研究 .pdf第3页

    试读已结束,剩余5页未读...

    15积分/C币 立即下载 >