麦克风及阵列的理解以及语音识别相关知识
一、麦克风阵列技术
(1) 定义:是一组位于空间不同位置的全向麦克风按一定的形状规则布
置形成的阵列,对声场的空间特性进行采样并滤波的系统。采集到
的信号包含了其空间位置信息。狭义概念,特指应用于语音处理的
按一定规则排列的多个麦克风系统,也可以简单理解为 2 个以上麦
克风组成的录音系统。
(2) 需求来源:消费级麦克风阵列的兴起得益于语音交互的市场火热,
主要解决远距离语音识别的问题,以保证真实场景下的语音识别率。
这涉及了语音交互用户场景的变化,当用户从手机切换到类似
Echo 智能音箱或者机器人的时候,实际上麦克风面临的环境就完
全变了,这就如同两个人窃窃私语和大声嘶喊的区别。
(3) 关键技术:消费级的麦克风阵列主要面临环境噪声、房间混响、人
声叠加、模型噪声、阵列结构等问题,若使用到语音识别场景,还
要考虑针对语音识别的优化和匹配等问题
二、声学器件
(1)传声器
传声器通常被称为麦克风,是一种将声音转换成电子信号的换能器件,即
把声信号转成电信号,其核心参数是灵敏度、指向性、频率响应、阻抗、动态
范围、信噪比、最大声压级、一致性等。传声器是语音识别的核心器件,决定
了语音数据的基本质量。
评论0
最新资源