CNN—matlab.rar_CNNmatlab_CNNMATLAB_CNN入门_LTSF_matlabCNN_LTSF资源-CSDN文库

共1个文件

docx：1个

版权申诉

5星 · 超过95%的资源 137 浏览量 2022-07-14 12:36:46 上传评论收藏 306KB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

package

CNN—matlab.rar （1个子文件）

CNN—matlab.docx 307KB

卷积神经网络 CNN 原理——结合实例 matlab 实现

卷积神经网络 CNN 是深度学习的一个重要组成部分，由于其优异的学习性能（尤其是

对图片的识别）。近年来研究异常火爆，出现了很多模型 LeNet、Alex net、ZF net 等等。由

于大多高校在校生使用 matlab 比较多，而网上的教程代码基本都基于 caffe 框架或者 python，

对于新入门的同学来说甚是煎熬，所以本文采用 matlab 结合 MNIst 手写数据库完成对手写

数字的识别。本人水平有限，如有纰漏，还望各路大神，帮忙指正。

一、卷积网络原理

1、动机

卷积神经网络（CNN）是多层感知机（MLP）的一个变种模型，它是从生物学概念中演

化而来的。从 Hubel 和 Wiesel 早期对猫的视觉皮层的研究工作，我们知道在视觉皮层存在

一种细胞的复杂分布，，这些细胞对于外界的输入局部是很敏感的，它们被称为“感受野”

（细胞），它们以某种方法来覆盖整个视觉域。这些细胞就像一些滤波器一样，它们对输入

的图像是局部敏感的，因此能够更好地挖掘出自然图像中的目标的空间关系信息。

此外，视觉皮层存在两类相关的细胞，S 细胞（Simple Cell）和 C（Complex Cell）细胞。

S 细胞在自身的感受野内最大限度地对图像中类似边缘模式的刺激做出响应，而 C 细胞具有

更大的感受野，它可以对图像中产生刺激的模式的空间位置进行精准地定位。

视觉皮层作为目前已知的最为强大的视觉系统，广受关注。学术领域出现了很多基于它

的神经启发式模型。比如：NeoCognitron [Fukushima], HMAX [Serre07] 以及本教程要讨论的

重点 LeNet-5 [LeCun98]。

2、稀疏连接

CNNs 通过加强神经网络中相邻层之间节点的局部连接模式（Local Connectivity Pattern）

来挖掘自然图像（中的兴趣目标）的空间局部关联信息。第 m 层隐层的节点与第 m-1 层的

节点的局部子集，并具有空间连续视觉感受野的节点（就是 m-1 层节点中的一部分，这部

分节点在 m-1 层都是相邻的）相连。可以用下面的图来表示这种连接。

假设，m-1 层为视网膜输入层（接受自然图像）。根据上图的描述，在 m-1 层上面的 m

层的神经元节点都具有宽度为 3 的感受野，m 层每一个节点连接下面的视网膜层的 3 个相

邻的节点。m+1 层的节点与它下面一层的节点有着相似的连接属性，所以 m+1 层的节点仍

与 m 层中 3 个相邻的节点相连，但是对于输入层（视网膜层）连接数就变多了，在本图中

是 5。这种结构把训练好的滤波器（corresponding to the input producing the strongest response）

构建成了一种空间局部模式（因为每个上层节点都只对感受野中的，连接的局部的下层节点

有响应）。根据上面图，多层堆积形成了滤波器（不再是线性的了），它也变得更具有全局

性了（如包含了一大片的像素空间）。比如，在上图中，第 m+1 层能够对宽度为 5 的非线

性特征进行编码（就像素空间而言）。

3、权值共享

在 CNNs 中，每一个稀疏滤波器 hi 在整个感受野中是重复叠加的，这些重复的节点形式

了一种特征图（feature map）,这个特种图可以共享相同的参数，比如相同的权值矩阵和偏

置向量。

在上图中，属于同一个特征图的三个隐层节点，因为需要共享相同颜色的权重, 他们的

被限制成相同的。在这里，梯度下降算法仍然可以用来训练这些共享的参数，只需要在原

算法的基础上稍作改动即可。共享权重的梯度可以对共享参数的梯度进行简单的求和得到。

二、网络的分析

上面这些内容，基本就是 CNN 的精髓所在了，下面结合 LeNet 做具体的分析。

结构图：

LeNet 算上输入输出一共为八层，下面逐层分析。

第一层：数据输入层

CNN 的强项在于图片的处理，lenet 的输入为 3232 的矩阵图片。这里需要注意的点：

1、数据的归一化，这里的归一化是广义的，不一定要归到 0-1，但要是相同的一个区

间范围，一般我们的灰度图为 0-255。

2、数据的去均值，如果样本有非零的均值，而且与测试部分的非零均值不一致，可能

就会导致识别率的下降。当然这不一定发生，我们这么做是为了增加系统的鲁棒性。

第二层：卷积层 c1

卷积层是卷积神经网络的核心，通过不同的卷积核，来获取图片的特征。卷积核相当于

一个滤波器，不同的滤波器提取不同特征。打个比方，对于手写数字识别，某一个卷积核提

取‘一’，另一个卷积核提取‘|’，所以这个数字很有可能就判定为‘7’。当然实际要比

这复杂度得多，但原理大概就是这个样子。

第三层：pooling 层

基本每个卷积层后边都会接一个 pooling 层，目的是为了降维。一般都将原来的卷积层

的输出矩阵大小变为原来的一半，方便后边的运算。另外，pooling 层增加了系统的鲁棒性，

把原来的准确描述变为了概略描述（原来矩阵大小为 2828，现在为 14*14，必然有一部分

信息丢失，一定程度上防止了过拟合）。

第四层：卷积层

与之前类似，在之前的特征中进一步提取特征，对原样本进行更深层次的表达。注意：

这里不是全连接。这里不是全连接。这里不是全连接。X 代表连接，空白代表不连。

第五层：pooling 层

与之前类似。

第六层：卷积层（全连接）

这里有 120 个卷积核，这里是全连接的。将矩阵卷积成一个数，方便后边网络进行判定。

第七层：全连接层

和 MLP 中的隐层一样，获得高维空间数据的表达。

第八层：输出层

这里一般采用 RBF 网络，每个 RBF 的中心为每个类别的标志，网络输出越大，代表越

不相似，输出的最小值即为网络的判别结果。

三、卷积网络的 BP 训练

前面的都很好理解，卷积神经网络的难度在于 BP 过程。网上 zouxy09 的博文写的很好，

可以看一下，自己搞明白。传送门：CNN 的 BP 推导(BP 指反向传播网络)

四、代码部分

关于 MNIST 数据集，网上有很多现成的代码对其进行提取，但提取出来的都是乱序的

很不利于使用。这里有提取好的分类后的，详情传送门

简单起见，我们的代码选用一层卷积层。

内容反馈

版权申诉

m0_74396643

2024-01-04

资源内容总结的很到位，内容详实，很受用，学到了~

APei

粉丝: 63
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip