%附加动量法 bp网 加入测试集 归一化
%采用三层网:输入层、第一隐层(tansig)、输出层(purelin)。隐层神经元取为4
%结论:需要2.5万次左右收敛,误差在0.05以内
clear all
clc
close all
nntwarn off
load('data.mat'); %载入实验数据
%生成训练样本和测试样本
%测试样本选取方法:每隔10个数据中随机选取一个数据作为测试样本,共10组数据。
%其他数据作为训练样本,共90组。
P=input;
T=output;
P_test=zeros(3,10);
T_test=zeros(1,10);
j=1;
for i=1:10:100
k=floor(rand(1,1)*10);
P_test(:,j)=input(:,i+k);
P(:,i+k-j+1)=[];
T_test(j)=output(i+k);
T(i+k-j+1)=[];
j=j+1;
end
[r,q]=size(P);
[s2,q]=size(T);
s1=4; %隐层神经元数量
%训练样本归一化
P1=P;
for i=1:3
P1(i,:)=(P(i,:)-min(input(i,:)))/(max(input(i,:))-min(input(i,:)));
end
T1=T;
for i=1:q
T1(i)=(T(i)-min(output))/(max(output)-min(output));
end
%测试样本归一化
P1_test=P_test;
for i=1:3
P1_test(i,:)=(P_test(i,:)-min(input(i,:)))/(max(input(i,:))-min(input(i,:)));
end
T1_test=T_test;
for i=1:10
T1_test(i)=(T_test(i)-min(output))/(max(output)-min(output));
end
w1=0.1*ones(s1,r);
b1=0.1*ones(s1,1);
dw1=0.1*zeros(s1,r);
db1=0.1*zeros(s1,1);
w2=0.1*ones(s2,s1);
b2=0.1*ones(s2,1);
dw2=0.1*zeros(s2,s1);
db2=0.1*zeros(s2,1);
err_goal=0.00005; %允许误差
max_epoch=100000; %最大学习轮数
lr=0.1; %学习率=0.1
mc=0.96; %mc为动量因子
epoch=1;
%pause;
for epoch=1:max_epoch
w1=w1+dw1;
w2=w2+dw2;
b1=b1+db1;
b2=b2+db2;
[A1,A2]=simuff(P1,w1,b1,'tansig',w2,b2,'purelin');
E=T1-A2;
SSE(epoch)=sumsqr(E);
if (SSE(epoch)<=err_goal)
figure
ploterr(SSE,err_goal)
break;
end
D2=deltalin(A2,E);
D1=deltatan(A1,D2,w2);
[dw2,db2]=learnbpm(A1,D2,lr,mc,dw2,db2);
[dw1,db1]=learnbpm(P1,D1,lr,mc,dw1,db1);
if (rem(epoch,5000)==0)
ploterr(SSE,err_goal);
SSE(epoch)
pause;
end
end
%网络输出与训练集的比较
[A1,A2]=simuff(P1,w1,b1,'tansig',w2,b2,'purelin');
for i=1:90 %反归一化
A(i)=A2(i)*(max(output)-min(output))+min(output);
end
figure
plot(1:90,A,'*');hold on
plot(1:90,T,'ro');legend('预测值','实际值',4);
title('网络输出与训练集比较');
%测试网络的泛化能力
[test1,test2]=simuff(P1_test,w1,b1,'tansig',w2,b2,'purelin');
for i=1:10 %反归一化
A_test(i)=test2(i)*(max(output)-min(output))+min(output);
end
%作图
figure
subplot(2,1,1);
plot(1:10,A_test,'*');
hold on;
plot(1:10,T_test,'ro');
title('测试该网络泛化能力');legend('预测值','实际值',4);
subplot(2,1,2);
plot(1:10,T_test-A_test);title('预测误差')