我这里简单说一下,LeNet5 这张图从左到右,先是 input,这
是输入层,即输入的图片。input-layer 到 C1 这部分就是一个
卷积层(convolution 运算),C1 到 S2 是一个子采样层
(pooling 运算),关于卷积和子采样的具体过程可以参考下
图:
然后,S2 到 C3 又是卷积,C3 到 S4 又是子采样,可以发现,卷
积和子采样都是成对出现的,卷积后面一般跟着子采样。S4 到
C5 之间是全连接的,这就相当于一个 MLP 的隐含层了(如果你
不清楚 MLP,参考《DeepLearning tutorial(3)MLP 多层感知
机原理简介+代码详解》)。C5 到 F6 同样是全连接,也是相当
于一个 MLP 的隐含层。最后从 F6 到输出 output,其实就是一
个分类器,这一层就叫分类层。
ok,CNN 的基本结构大概就是这样,由输入、卷积层、子采样
层、全连接层、分类层、输出这些基本“构件”组成,一般根
据具体的应用或者问题,去确定要多少卷积层和子采样层、采
用什么分类器。当确定好了结构以后,如何求解层与层之间的
连接参数?一般采用向前传播(FP)+向后传播(BP)的方法来
训练。具体可参考上面给出的链接。