CNN、、LeNet
一、卷积神经网络一、卷积神经网络
卷积层:卷积层:卷积层得名于卷积运算,但卷积层中用到的并非卷积运算而是互相关运算。我们将核数组核数组 (通常称为卷积核或过滤器(通常称为卷积核或过滤器(filter)))上下翻
转、左右翻转,再与输入数组做互相关运算,这一过程就是卷积运算。由于卷积层的核数组是可学习的,所以使用互相关运算与使用卷积运算
并无本质区别。
卷积层的两个超参数:填充填充:在输入高和宽的两侧填充元素(通常是0元素)
步幅步幅:在互相关运算中,卷积核在输入数组上滑动,每次滑动的行数与列数即是步幅(stride)
池化层:池化层:池化层主要用于缓解卷积层对位置的过度敏感性。同卷积层一样,池化层每次对输入数据的一个固定形状窗口(又称池化窗口)中的
元素计算输出,池化层直接计算池化窗口内元素的最大值或者平均值,该运算也分别叫做最大池化或平均池化。
二、二、LeNet
Convolutional Neural Networks
使用全连接层的局限性:
图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。
对于大尺寸的输入图像,使用全连接层容易导致模型过大。
使用卷积层的优势:
卷积层保留输入形状。
卷积层通过滑动窗口将同一卷积核与不同位置的输入重复计算,从而避免参数尺寸过大。
LeNet模型分为卷积层块和全连接层两个部分。
卷积神经网络就是含卷积层的网络。卷积神经网络就是含卷积层的网络。 LeNet交替使用卷积层和最大池化层后接全连接层来进行图像分类。交替使用卷积层和最大池化层后接全连接层来进行图像分类。
卷积层块里的基本单位是卷积层后接平均池化层:卷积层块里的基本单位是卷积层后接平均池化层:卷积层用来识别图像里的空间模式,如线条和物体局部,之后的平均池化层则用来降低卷积
层对位置的敏感性。
卷积层块由两个这样的基本单位重复堆叠构成。在卷积层块中,每个卷积层都使用5×55×5的窗口,并在输出上使用sigmoid激活函数。第一个
卷积层输出通道数为6,第二个卷积层输出通道数则增加到16。
全连接层块含3个全连接层。它们的输出个数分别是120、84和10,其中10为输出的类别个数。
三、深度卷积网络三、深度卷积网络(AlexNet)
LeNet:
LeNet: 在大的真实数据集上的表现并不尽如意。
1.神经网络计算复杂。
2.还没有量深研究参数初始化和凸优化算法等诸多领域。
机器学习的特征提取特征提取:手工定义的特征提取函数
神经网络的特征提取特征提取:通过学习得到数据的多级表征,并逐级表越来越抽象的概念或模式。
神经网络发展的限制:数据、硬件
AlexNet:
AlexNet: 首次证明了学习到的特征可以超越设计的特征,从而举打破计算机视觉研究的前状。
特征:特征:
1. 8层变换,其中有5层卷积和2层全连接隐藏层,以及1个全连接输出层。
2. 将sigmoid激活函数改成了更加简单的ReLU激活函数。
3. 用Dropout来控制全连接层的模型复杂度。