基音周期估计是语音信号处理中的一项重要技术,对于语音分析、合成、识别等任务至关重要。基音周期是指在一定时间内,声带振动产生的基音波的周期,它与语音信号的音高直接相关。在数字语音模型中,基音周期不仅反映了声音的音调特性,也是激励源模型的一个关键参数。
传统的基音周期估计方法包括线性预测分析法、AMDF(短时平均幅度差函数)法和Seneff法等。AMDF方法是通过计算语音信号短时平均幅度差来估计基音周期的一种方法。它通过定义短时平均幅度差函数,来比较原始语音信号与经过时间延迟的信号之间的相似度。然而,AMDF方法在计算过程中存在误差累积问题,并且在处理幅度和频率快速变化的语音信号时,估计精度会明显下降。
针对AMDF方法的不足,本研究提出了改进的MAMDF(Modified AMDF)方法。MAMDF方法在保留AMDF优点的同时,通过引入分母项对能量进行归一化处理,以提高基音周期估计的准确性和连续性。MAMDF方法的短时平均幅度差函数计算范围随延时变化,保证了在基音周期处有较高的估计准确性。与传统AMDF方法相比,MAMDF方法在语音信号波形平缓时等效,但在幅度和频率快速变化时,MAMDF方法能够提供更好的估计精度和时域分辨度。
实验结果显示,当语音信号波形平缓,语音周期变化较慢时,MAMDF方法与AMDF方法的估计结果是等效的。但是,对于具有快速变化幅度和频率的语音信号,MAMDF方法能显著提高基音周期的估计精度。这主要是由于MAMDF方法克服了AMDF方法在数据长度选择上的矛盾,使得它能够更灵活地适应信号变化,从而提高估计的准确性和时域分辨度。
MAMDF方法的实现需要调整样本幅度差的计算范围,以适应不同发音人的发音周期变化。例如,对于男声和女声发音,选择合适的T范围可以提高基音周期估计的准确性。此外,MAMDF方法的定义中引入的分母项,使得DMAMDF函数在基音周期处具有准确性和连续性,这是该方法相比于传统AMDF方法的一个显著优势。
MAMDF方法的成功应用,展示了在语音信号处理领域进行算法优化和创新的重要性。通过针对性的改进和实验验证,不仅能够解决现有技术的局限,还可以提升语音处理任务的整体性能和准确性,这对于促进语音识别技术的发展具有积极的意义。