![](https://csdnimg.cn/release/download_crawler_static/86386849/bg1.jpg)
FFT:对非平稳信号存在局限性,只能描述全局的频率特点,但是对于频域细节(各成分出
现时刻并无所知),因此,时域相差很大的信号可能频谱相同。
STFT:相当于对时域信号先进行加窗,然后对每段信号进行傅立叶变换。虽然可以描述频域
的细节,但是 STFT 的选择相对困难,窗太窄,窗内信号太短,导致频率分析不够精准,频
率分辨率差;窗太宽,时域上不够精细,时间分辨率低
小波变换:将无限长的三角函数基换成了有限长的会衰减的小波基。小波基有两个变量:尺
度和平移量,尺度控制小波函数伸缩——对应频率(反比),平移量控制小波函数平移——
对应时间,因此可以同时反映时域信息和频域信息。低频部分具有较低的时间分辨率和较高
的频率分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,很适合于分析非平
稳的信号和提取信号的局部特征
频谱混叠:采样频率不满足奈奎斯特定理后,频域周期延拓频谱出现重叠
频谱泄露:时间信号在进行运算时,需要将其截断,通常采用加窗操作,加窗相当于时域相
乘,也即频域卷积,于是频谱中除了本该有的主瓣之外,还出现本不该有的旁瓣,这就是频
谱泄露。整周期截断是不发生频谱泄露的充要条件,采用合适的缓变窗函数,减小旁瓣能量。
栏栅效应:DFT 变换只限制在离散的频谱,就像通过栏栅看景象,只能在特定点上看到真实
的景象。减少栏栅效应的方法:增加频域抽样点
因果稳定系统:输出只有当前和之前的输入有关,和之后的信息无关。充要条件:h(n) =
0,n<0
MFCC:
预加重:将音频信号通过高通滤波器,提升高频部分,突出高频的共振峰,高频包含细
节信息;
分帧:音频信号在整体上是非平稳信号,但是局部是平稳的,采用分帧可以更方便观察
音频特性,分帧音频会有重叠区域;
加窗:平滑信号,使用汉明窗可以减弱 FFT 以后旁瓣大小和频谱泄露
FFT:音频频域上特性相较于时域更容易观察
三角带通滤波器:将能量谱通过一组 Mel 尺度的三角滤波器组,对频谱进行平滑化,
并消除谐波,突出原来语音的共振峰,另外可以降低运算量
能量值取 log:由于人耳对声音感知并不是线性,用 log 这种非线性关系更好描述
DCT 变换:能量集中在低频部分,用于压缩
评论0
最新资源