精品文档
1 卷积神经网络
卷积神经网络是深度学习的一种,已成为当前图像理解领域的研究热点它的权值共享网
络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。这个优
点在网络的输入是多维图像时表现得更为明显, 图像可以直接作为网络的输入,避免了传统
识别算法中复杂的特征提取和数据重建过程 . 卷积网络是为识别二维形状而特殊设计的一
个多层感知器,这种网络结构对平移、比例缩放以及其他形式的变形具有一定不变性. 在典
型的 CNN 中,开始几层通常是卷积层和下采样层的交替, 在靠近输出层的最后几层网络通
常是全连接网络。卷积神经网络的训练过程主要是学习卷积层的卷积核参数和层间连接权重
等网络参数, 预测过程主要是基于输入图像和网络参数计算类别标签。卷积神经网络的关键
是:网络结构(含卷积层、下采样层、全连接层等) 和反向传播算法等。在本节中, 我们先介
绍典型 CNN 的网络结构和反向传播算法, 然后概述常用的其他 CNN 网络结构和方法。神
经网络参数的中文名称主要参考文献
[18]
卷积神经网络的结构和反向传播算法主要参考文献
[17]
。
1.1
网络结构
1.1.1
卷积层
在卷积层, 上一层的特征图(Feature map) 被一个可学习的卷积核进行卷积, 然后通过
一个激活函数(Activation function), 就可以得到输出特征图. 每个输出特征图可以组合卷积
多个特征图的值
[17]
:
x
l
j
f (u
l
j
)
u
l
j
l
iM
j
x
l 1
j
l
k
ij
b
l
j
其中,
u
j
称为卷积层l的第j 个通道的净激活(Netactivation), 它通过对前一层输出特征
图
x
j
进行卷积求和与偏置后得到的,
x
j
是卷积层l的第j 个通道的输出。
f ( )
称为激活函
数, 通常可使用sigmoid 和tanh 等函数。
M
j
表示用于计算
u
j
的输入特征图子集,
k
ij
是卷
积核矩阵,
b
j
是对卷积后特征图的偏置。对于一个输出特征图
x
j
,每个输入特征图
x
j
对
应的卷积核
k
ij
可能不同,“*”是卷积符号。
l
l l l1
l l
l1 l
1.1.2
下采样层
下采样层将每个输入特征图通过下面的公式下采样输出特征图
[17]
:
x
l
j
f (u
l
j
)
u
l
j
l
j
down(x
l
j
1
) b
l
j
其中,
u
j
称为下采样层l的第j 通道的净激活, 它由前一层输出特征图
x
j
进行下采样加
l l1
精品文档