rnn.rar_RNN_surei4m资源-CSDN文库

共1个文件

m：1个

版权申诉

38 浏览量 2022-07-15 07:13:23 上传评论收藏 2KB RAR 举报

资源详情

资源评论

资源推荐

收起资源包目录

rnn.rar （1个子文件）

rnn.m 6KB

% implementation of RNN clc clear close all %% training dataset generation binary_dim = 8; largest_number = 2^binary_dim-1; binary = cell(largest_number,1); int2binary = cell(largest_number,1); for i = 1:largest_number+1 binary{i} = dec2bin(i-1, 8); int2binary{i} = binary{i}; end %% input variables alpha = 0.1; input_dim = 2; hidden_dim = 16; output_dim = 1; %% initialize neural network weights synapse_0 = 2*rand(input_dim,hidden_dim) - 1; synapse_1 = 2*rand(hidden_dim,output_dim) - 1; synapse_h = 2*rand(hidden_dim,hidden_dim) - 1; synapse_0_update = zeros(size(synapse_0)); synapse_1_update = zeros(size(synapse_1)); synapse_h_update = zeros(size(synapse_h)); %% train logic for j = 0:19999 % generate a simple addition problem (a + b = c) a_int = randi(round(largest_number/2)); % int version a = int2binary{a_int+1}; % binary encoding b_int = randi(floor(largest_number/2)); % int version b = int2binary{b_int+1}; % binary encoding % true answer c_int = a_int + b_int; c = int2binary{c_int+1}; % where we'll store our best guess (binary encoded) d = zeros(size(c)); if length(d)<8 pause; end overallError = 0; layer_2_deltas = []; layer_1_values = []; layer_1_values = [layer_1_values; zeros(1, hidden_dim)]; % 开始对一个序列进行处理，搞清楚一个东西，一个LSTM单元的输出其实就是隐含层 for position = 0:binary_dim-1 X = [a(binary_dim - position)-'0' b(binary_dim - position)-'0']; % X 是 input y = [c(binary_dim - position)-'0']'; % Y 是label，用来计算最后误差 % 这里是RNN，因此隐含层比较简单 % X ------------------------> input % sunapse_0 ----------------> U_i % layer_1_values(end, :) ---> previous hidden layer （S(t-1)） % synapse_h ----------------> W_i % layer_1 ------------------> new hidden layer (S(t)) layer_1 = sigmoid(X*synapse_0 + layer_1_values(end, :)*synapse_h); % layer_1 ------------------> hidden layer (S(t)) % layer_2 ------------------> 最终的输出结果，其维度应该与 label (Y) 的维度是一致的 % 这里的 sigmoid 其实就是一个变换，将 hidden layer (size: 1 x 16) 变换为 1 x 1 % 有写时候，如果输入与输出不匹配的话，使可以使用 softmax 进行变化的 % output layer (new binary representation) layer_2 = sigmoid(layer_1*synapse_1); % 计算误差，根据误差进行反向传播 % layer_2_error ------------> 此次（第 position+1 次的误差） % l 是真实结果 % layer_2 是输出结果 % layer_2_deltas 输出层的变化结果，使用了反向传播，见那个求导（输出层的输入是 layer_2，那就对输入求导即可，然后乘以误差就可以得到输出的diff） % did we miss?... if so, by how much? layer_2_error = y - layer_2; layer_2_deltas = [layer_2_deltas; layer_2_error*sigmoid_output_to_derivative(layer_2)]; % 总体的误差（误差有正有负，用绝对值） overallError = overallError + abs(layer_2_error(1)); % decode estimate so we can print it out % 就是记录此位置的输出，用于显示结果 d(binary_dim - position) = round(layer_2(1)); % 记录下此次的隐含层 (S(t)) % store hidden layer so we can use it in the next timestep layer_1_values = [layer_1_values; layer_1]; end % 计算隐含层的diff，用于求参数的变化，并用来更新参数，还是每一个timestep来进行计算 future_layer_1_delta = zeros(1, hidden_dim); % 开始进行反向传播，计算 hidden_layer 的diff，以及参数的 diff for position = 0:binary_dim-1 % 因为是通过输入得到隐含层，因此这里还是需要用到输入的 % a -> (operation) -> y, x_diff = derivative(x) * y_diff % 注意这里从最后开始往前推 X = [a(position+1)-'0' b(position+1)-'0']; % layer_1 -----------------> 表示隐含层 hidden_layer (S(t)) % prev_layer_1 ------------> (S(t-1)) layer_1 = layer_1_values(end-position, :); prev_layer_1 = layer_1_values(end-position-1, :); % layer_2_delta -----------> 就是隐含层的diff % hidden_layer_diff,根据这个可以推算输入的diff以及上一个隐含层的diff % error at output layer layer_2_delta = layer_2_deltas(end-position, :); % 这个地方的 hidden_layer 来自两个方面，因为 hidden_layer -> next timestep, hidden_layer -> output， % 因此其反向传播也是两方面 % error at hidden layer layer_1_delta = (future_layer_1_delta*(synapse_h') + layer_2_delta*(synapse_1')) ... .* sigmoid_output_to_derivative(layer_1); % let's update all our weights so we can try again synapse_1_update = synapse_1_update + (layer_1')*(layer_2_delta); synapse_h_update = synapse_h_update + (prev_layer_1')*(layer_1_delta); synapse_0_update = synapse_0_update + (X')*(layer_1_delta); future_layer_1_delta = layer_1_delta; end synapse_0 = synapse_0 + synapse_0_update * alpha; synapse_1 = synapse_1 + synapse_1_update * alpha; synapse_h = synapse_h + synapse_h_update * alpha; synapse_0_update = synapse_0_update * 0; synapse_1_update = synapse_1_update * 0; synapse_h_update = synapse_h_update * 0; if(mod(j,1000) == 0) err = sprintf('Error:%s\n', num2str(overallError)); fprintf(err); d = bin2dec(num2str(d)); pred = sprintf('Pred:%s\n',dec2bin(d,8)); fprintf(pred); Tru = sprintf('True:%s\n', num2str(c)); fprintf(Tru); out = 0; size(c) sep = sprintf('-------------\n'); fprintf(sep); end end