clear;
j=sqrt(-1);
%读取一段语音
%[filename,pathname]=uigetfile('*.wav','请选择语音文件:');
[x,fs,nbits]=wavread('abama.wav',[1 208210]);
[y,fs,nbits]=wavread('ab.wav',[1 208210]);
wavin=10*x;%+0.3*y;
wbvin=10*x+0.3*y;
sound(wavin,fs,nbits);
%[wavin,fs,nbits]=wavread(z); %提取语音特征信息,wavin保存.wav的抽样值,fs保存该信号的抽样频率
wav_length=length(wavin);
%设置基本信息
%基音周期最大为20ms,为使ifft还原后语音失真尽量小,帧长至少要为基音周期的2倍
%根据fs选择帧长 %定义帧长fram_len,和步长step_len 步长为帧长的一半
switch fs
case 8000
frame_len=320;step_len=160;
case 10000
frame_len=400;step_len=200;
case 12000
frame_len=480;step_len=240;
case 16000
frame_len=640;step_len=320;
case 44100
frame_len=1800;step_len=900;
otherwise
frame_len=1800;step_len=900;
end;
n_frame=fix((wav_length-frame_len)/step_len)+1; %确定帧数
%分帧
for i=1:n_frame
n1=(i-1)*step_len+1;
n2=(i-1)*step_len+frame_len;
S(i,:)=wavin(n1:n2);
end
win_ham=hamming(frame_len); %定义汉明窗函数
%取前15帧学习噪声
noise_foward15frame=zeros(15,frame_len);%定义一个数组放前15帧的噪音短时傅立叶变换结果
for nifrm=1:15
nf=fft(win_ham.*(S(nifrm,1:frame_len)'),frame_len);
noise_foward15frame(nifrm,:)=noise_foward15frame(nifrm,:)+(abs(nf)'); %noise_foward15frame保存前15帧的噪音短时傅立叶变换幅度结果
end
am_noise=mean(noise_foward15frame(:,1:frame_len));%求出每帧的噪声幅度
%用谱减法进行语音增强
sum_timedomain=zeros(n_frame,frame_len);%定义一个数组放时域和的结果
voice_timedomain=zeros(n_frame,frame_len);%定义一个数组放去噪后的语音的时域
for ifrm=1:n_frame
sum_timedomain(ifrm,1:frame_len)=sum_timedomain(ifrm,1:frame_len)+(win_ham').*S(ifrm,1:frame_len);%sum_timedomain保存整个语音信号的时域和的结果
sf=fft((win_ham').*S(ifrm,:),frame_len);
phase=angle(sf);%保存这帧语音信号的傅立叶变换的结果的相位
am_signal=abs(sf); %保存这帧语音信号的傅立叶变换的结果的幅度
am_voice=am_signal-am_noise; %谱减 %用信号的幅度减去噪声的幅度得到纯净语音的幅度
for b=1:frame_len
if(am_voice(1,b)<0)
am_voice(1,b)=0;
end
end
voice=am_voice.*exp(j*phase);%组合相位与幅度得到去噪后的纯净语音信号
sif=real(ifft(voice,frame_len));% 求这帧纯净语音信号的傅立叶反变换的实部
voice_timedomain(ifrm,:)=voice_timedomain(ifrm,:)+sif;%voice_timedomain保存整个去噪后的语音信号的时域和的结果
end
%求出纯净语音信号的真实幅度
wavout=zeros(1,wav_length);
for d=1:n_frame
m1=(d-1)*step_len+1;
m2=(d-1)*step_len+frame_len;
wavout(m1:m2)=wavout(m1:m2)+voice_timedomain(d,1:frame_len);
end
%将处理结果输出为'wav'文件
wavwrite(wavout,fs,nbits,['去噪后的语音']);
sound(wavout,fs,nbits);
%将处理前后的结果进行作图比较
subplot(2,1,1);
plot(wavin);grid on;
axis([1 wav_length -1 1]);
subplot(2,1,2);
plot(wbvin);grid on;
axis([1 wav_length -4 4]);
- 1
- 2
前往页