误差反向传播(ANN人工神经网络)_误差传递资源-CSDN文库

共7个文件

py：7个

神经网络

机器学习

人工智能

深度学习

5星 · 超过95%的资源需积分: 37 74 浏览量 2022-02-10 18:44:42 上传评论收藏 5KB ZIP 举报

误差反向传播（Backpropagation，简称BP）是深度学习领域中最常见的训练人工神经网络（Artificial Neural Network，ANN）的算法。它主要用于调整网络中权重和偏置，以最小化预测结果与实际值之间的误差。在本项目中，我们看到的是如何利用BP算法构建一个两层神经网络来识别MNIST手写数字数据集。 MNIST数据集包含60,000个训练样本和10,000个测试样本，每个样本都是28x28像素的灰度图像，代表0到9的手写数字。BP算法通过迭代过程，对每个样本进行前向传播计算预测结果，并使用梯度下降优化方法更新权重，以提高模型在训练集上的表现。文件"bp_two_layer_net.py"可能包含了实现BP算法的主体代码，它定义了网络结构，包括输入层、隐藏层和输出层。"net_layer.py"可能是定义神经网络层的模块，包括前向传播和反向传播的函数。"train_bp_two_neuralnet.py"很可能是训练脚本，调用前面的网络和训练数据，执行多次迭代以优化权重。 "buy_orange_apple.py"、"layer_naive.py"、"gradient_check.py"和"buy_apple.py"这四个文件的名称看起来与主题不太直接相关，但它们可能是辅助代码或者示例程序。"buy_orange_apple.py"可能是一个简单的决策问题，用于帮助理解基本的逻辑操作；"layer_naive.py"可能包含了一个基础的神经网络层实现，没有使用高级库；"gradient_check.py"可能是用来验证反向传播计算梯度正确性的工具，这对于调试深度学习模型至关重要；而"buy_apple.py"可能是另一个类似的小示例，用于教学或练习目的。在BP算法中，计算图的概念很重要。计算图将计算过程表示为一系列节点和边，节点代表操作，边代表数据。在反向传播过程中，通过计算图的反向遍历，可以高效地计算出每个参数对损失函数的影响，从而更新参数。在深度学习中，神经网络的优化通常依赖于梯度下降算法，它根据梯度的方向和大小来更新权重。对于大型网络，通常采用随机梯度下降（Stochastic Gradient Descent, SGD）或其变种，如动量SGD、Adam等，以提高训练速度和避免局部最优。总结来说，这个项目涉及了误差反向传播算法在神经网络中的应用，特别是在解决MNIST手写数字识别问题上的实践。通过理解和实现这些文件，我们可以深入理解BP算法的工作原理，以及如何在实际问题中构建和训练神经网络。同时，它也展示了计算图和梯度检查在深度学习模型开发中的关键作用。

资源详情

资源评论

资源推荐

收起资源包目录

bp_layer.zip （7个子文件）

buy_orange_apple.py 869B

buy_apple.py 489B

bp_two_layer_net.py 3KB

train_bp_two_neuralnet.py 2KB

net_layer.py 2KB

layer_naive.py 683B

gradient_check.py 637B

import numpy as np from collections import OrderedDict from net_layer import * from deeplearning.fuction import numerical_gradient class TwoLayerNet: def __init__(self,input_size,hidden_size,output_size, weight_init_std=0.01): #初始化权重 self.params = {} self.params['W1'] = weight_init_std*np.random.randn(input_size,hidden_size) self.params['b1'] = np.zeros(hidden_size) self.params['W2'] = weight_init_std*np.random.randn(hidden_size,output_size) self.params['b2'] = np.zeros(output_size) """ OrderedDict是有序字典 """ #生成层 self.layers = OrderedDict() self.layers['Affine1'] = Affine(self.params['W1'],self.params['b1']) self.layers['Relu1'] = Relu() self.layers['Affine2'] = Affine(self.params['W2'],self.params['b2']) self.lastLayer = SoftMaxTithLoss() #有序字典的作用体现在向前传播 def predict(self,x): for layer in self.layers.values(): x = layer.forward(x) return x #损失函数我们以前得到的y是softmax之后的，现在的predict并没有经过softmax def loss(self,x,t): y = self.predict(x) return self.lastLayer.forward(y,t) def accuracy(self,x,t): y = self.predict(x) #y获得得分情况 y = np.argmax(y,axis = 1) #没经过softmax y获得最高得分 if t.ndim != 1 : #如果t是1维 axis=1会出错,mini_batch不会是1维 t = np.argmax(t,axis = 1) acuracy = np.sum((y==t)/float(x.shape[0])) return acuracy #数值微分法求梯度 def numerical_gradient(self,x,t): loss_W = lambda W:self.loss(x,t) grads = {} grads['W1'] = numerical_gradient(loss_W,self.params['W1']) grads['b1'] = numerical_gradient(loss_W, self.params['b1']) grads['W2'] = numerical_gradient(loss_W, self.params['W2']) grads['b2'] = numerical_gradient(loss_W, self.params['b2']) return grads #误差反向传播求梯度 def gradient(self,x,t): #forward 向前传播就是获取损失函数值的过程 self.loss(x,t) #backward dout = 1 dout = self.lastLayer.backward(dout) layers = list(self.layers.values()) layers.reverse() for layer in layers: dout = layer.backward(dout) grads = {} grads['W1'] = self.layers['Affine1'].dW grads['b1'] = self.layers['Affine1'].db grads['W2'] = self.layers['Affine2'].dW grads['b2'] = self.layers['Affine2'].db return grads