描述了利用人耳的听觉掩蔽效应来对巴克谱失真距离测度进行改进,并将这些测度应用在客观音质评价中,以提高主客观音质评价的相关度。改进的测度动态地确定语音信号每个巴克带的掩蔽门限,有选择性地计算失真距离,只包含听觉能够感知的失真。针对特定失真语音条件下的实验仿真结果表明,主客观评价结果之间具有更高的相关系数。可以推断这些测度作为对语音系统进行的客观音质评价,会具有好的有效性和实用性。
### 一种改进的客观音质评价方法
#### 概述
在通信技术中,语音质量评价是一项关键任务,尤其在语音编解码技术及其标准不断发展的背景下。语音质量评价主要分为两大类:主观评价和客观评价。主观评价方法如平均意见分(MOS)能很好地反映用户对语音质量的真实感受,但其耗时且易受个人主观因素的影响。相反,客观评价方法虽然高效快速,但由于缺乏对语言语音学中重要因素(如语义、语调等)的考量,往往难以完全替代主观评价。
#### 改进的目标
为了提高客观评价的有效性和实用性,特别是提高其与主观评价的相关性,研究者们提出了一种基于听觉掩蔽效应改进的巴克谱失真(BSD)测度。该方法通过动态确定语音信号中每个巴克带的掩蔽门限,并有选择性地计算失真距离,仅包括人耳可感知的失真部分。
#### 听觉掩蔽效应
人耳的听觉系统具有多种掩蔽效应,包括瞬时掩蔽效应和同时性掩蔽效应。瞬时掩蔽效应又分为前向掩蔽和后向掩蔽。后向掩蔽效应指的是较高能量的信号(掩蔽音)能够掩盖较早出现的较低能量信号(被掩蔽音)的现象。这一效应表明,在短时间内,语音信号的感知会受到后续信号强度的影响。
#### MBSD测度
##### 1.1 后向掩蔽效应的应用
MBSD测度利用了后向掩蔽效应来改进原有的BSD测度。该方法考虑到了听觉系统的适应性,即人耳在处理信号时会在一定程度上受到随后更强信号的影响。具体而言,MBSD测度通过以下步骤进行:
1. **听觉感知线性分析**:对语音信号的短时功率谱进行预处理,包括临界频带分析、等响度曲线预加重以及强度-响度转换。
2. **巴克谱变换**:将处理后的功率谱转换为符合人耳听觉特性的巴克谱。
3. **失真距离测量**:在巴克谱的基础上度量失真距离。
4. **掩蔽门限去除**:从失真距离中去除低于掩蔽门限的巴克谱分量。
通过这种方式,MBSD测度能够更加准确地反映人耳对失真的感知。
#### NBSD测度
NBSD测度则是利用同时性掩蔽效应来进一步改进测度。这种方法主要关注的是在同一时间点内不同频率成分之间的相互影响。NBSD测度同样遵循上述四个基本步骤,但在掩蔽门限的设定上有所不同。NBSD测度考虑了纯音对纯音、纯音对噪声以及噪声对纯音的掩蔽效应,从而更精确地反映了听觉系统的特性。
#### 实验验证
为了验证改进的测度的有效性,研究者们进行了针对特定失真语音条件的实验仿真。结果显示,采用改进后的MBSD和NBSD测度进行的客观音质评价与主观评价的相关系数显著提高,证明了这些方法的有效性和实用性。
#### 结论
本研究通过引入听觉掩蔽效应改进了巴克谱失真测度,提高了客观音质评价方法的有效性和与主观评价的相关性。通过利用后向掩蔽效应和同时性掩蔽效应,MBSD和NBSD测度能够更准确地模拟人耳的听觉感知过程,进而提升了对语音系统客观评价的准确性。这对于优化通信系统中的语音质量评估具有重要意义。