反向传播推导(单个样本):
1、先计算输出层误差:
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
a
a
a
a
C
a
C
a
C
a
a
C
a
a
C
a
a
C
C
C
C
3
1
2
2
1
1
3
2
1
3
1
3
2
2
2
1
1
1
3
2
1
3
2
1
z
z
z
z
z
z
z
z
z
用矩阵表示就是(其中
为激活函数):
(BP1)
2、使用上层误差(输出层)
表示前层误差
:
其实就是要求:
1
2
1
1
1
1
L
L
L
L
Z
C
(BP2)
我们先对 L-1 层中的第一个神经单元进行求导,即求:
经过正向传播给了后面 L 层的所有神经元,因此在对
求导时,应该是由三部分(图
中红色线)组成: