
基于卷积神经网络的图像识别设计与实现
摘 要:图像分类任务是计算机视觉的核心,实际应用广泛,图像分类对人类来说是个十分简单的问题,而对于计算
机来说却并不容易。卷积神经网络的能力强大,其结构特别适用于解决计算机视觉任务。通过卷积神经网络对采集结
果的训练
,
得到用来识别的各类特征
,
识别的结果可以得到图像的类别信息。本文就深度学习在计算机视觉领域的应用进
行简单的实践与叙述,目标是实现基于卷积神经网络的图像识别与分类。卷积神经网络在图像识别领域属于较经典、
较成熟的模型。本文中利用卷积神经网络实现图像的分类问题,实现使用的是谷歌深度学习框架
Tensorflow
,使用果
蔬图像数据集合训练模型后,可以达到随机输入单张果蔬图片,返回图片分类结果的效果。
关键词:卷积层神经网络;
深度学习;
图像识别;
Tensorflow
0
引言
随着科学技术的飞速发展,图像识别技术在社会各领域得
以应用。图形识别技术可以作为一项基础技术应用于如工业零
件分类、人脸识别以及手势识别等。当前的图像识别也是作为
一项十分热门的技术被大众所广泛讨论。深度学习是机器学习
的一个新的热门研究方向,其旨在模仿人类的学习模式,通过
对输入样本的训练与测试,由简及深地提取特征来区分样本。
通过深度学习来进行图像识别也是如此,通过对于图像样本的
训练和测试,对样本进行分类。一般来说,深度学习网络满足
多层结构、自动进行特征提取和自动更新网络权重等特点。
卷积神经网络
(Convolutional Neural Network, CNN)
作为深
度学习的经典模型,一 直备受关注。卷积神经网络,简称
CNN
,
是多层神经网络模型的一个变种,受到生物学的启发,卷积神
经网络在图像领域得到了广泛的应用。最早的神经网络模型是
1998
年由
LeCun
等人提出的
LeNet5m
,它以交替出现的卷积层
和池化层作为基础的主干网络,结合全连接层组成完整的网络
结构。在
2012
年,
Krizhevsky
等人设计了
AlexNetN
网络,它
的主干网络包含了五个卷积层,全连接层增加到三个,并且将
传统的激活函 数替换成
ReLU
函数。
2013
年,
MinLin
在
NetworkinNetworkN
中首次明确提出了在进行卷积运算的时候
使用
1Xl
的卷积核。
2014
年,
Szegedv
等人提出了并行卷积的
Inception
模块。
2015
年,
HeK
等人提出了使用两个
3x3
的卷积
核代替原来的
5x5
的卷积核的
MSRA-Net[S]
,使网络的性能得
到非常大的提升。同年,
HeK
等人提出的
RestNet
网络,进一
步提升了网络性能。本文讨论卷积神经网络应用在图像识别这
一课题。
1
卷积神经网络简介
卷积神经网络是一种带有卷积结构的深度神经网络,卷积
结构可以减少深层网络占用的内存量,其三个关键的操作,其
一是局部感受野,其二是权值共享,其三是
pooling
层,有效
的减少了网络的参数个数,缓解了模型的过拟合问题。
1.1
网络结构
1.1.1
卷积神经网络整体架构
卷积神经网络是一种多层的监督学习神经网络,隐含层的
卷积层和池采样层是实现卷积神经网络特征提取功能的核心模
块。该网络模型通过采用梯度下降法最小化损失函数对网络中
的权重参数逐层反向调节,通过频繁的迭代训练提高网络的精
度。卷积神经网络的低隐层是由卷积层和最大池采样层交替组
成,高层是全连接层对应传统多层感知器的隐含层和逻辑回归
分类器。第一个全连接层的输入是由卷积层和子采样层进行特
征提取得到的特征图像。最后一层输出层是一个分类器,可以
采用逻辑回归,
Softmax
回归甚至是支持向量机对输入图像进
行分类。
1.1.2
卷积神经网络结构包括
卷积层,降采样层,全链接层。每一层有多个特征图,每
个特征图通过一种卷积滤波器提取输入的一种特征,每个特征
图有多个神经元。输入图像统计和滤波器进行卷积之后,提取
该局部特征,一旦该局部特征被提取出来之后,它与其他特征
的位置关系也随之确定下来了,每个神经元的输入和前一层的
局部感受野相连,每个特征提取层都紧跟一个用来求局部平均
与二次提取的计算层,也叫特征映射层,网络的每个计算层由
多个特征映射平面组成,平面上所有的神经元的权重相等。通
常将输入层到隐藏层的映射称为一个特征映射,也就是通过卷
积层得到特征提取层,经过
pooling
之后得到特征映射层。
1.2
局部感受野与权值共享
卷积神经网络的核心思想就是局部感受野、是权值共享和
pooling
层,以此来达到简化网络参数并使得网络具有一定程度
的位移、尺度、缩放、非线性形变稳定性。
1.2.1
局部感受野
由于图像的空间联系是局部的,每个神经元不需要对全部
的图像做感受,只需要感受局部特征即可,然后在更高层将这
些感受得到的不同的局部神经元综合起来就可以得到全局的信