没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
科技创新
76
Ke Ji Chuang Xin
摘要:
针对小样本图片分类训练过慢和容易过拟合的难题,本文提出一
种基于迁移学习的卷积神经网络的分类方法,以期取得较好的识别效
果。该方法通过微调已训练好VGG16网络模型中特征提取的部分,增加
规范层和输出层,进行迁移学习。实验表明,图像分类取得了较好的分
类结果,平均分类准确度达到93.38% 。该模型具有泛化能力较强、准
确率较高、训练速度快等特点,这为小样本动物图像的识别研究提供了
参考和借鉴。
关键词:
迁移学习;图像识别;卷积神经网络;VGG16网络模型;小样
本数据集
在自然界中,猴子的种类有多达262种,普通人如何准确地区分猴子
种类是一个难题,因此解决此问题有很大的研究意义。卷积神经网络是解
决此类问题的典型代表,因此。本文研究的是针对不同种类的猴子进行识
别,利用卷积神经网络把不同品种的猴子分到不同的类别中,从而准确地
识别出猴子的种类。
1材料与方法
1.1样本批量归一化处理
由于猴子品种不同,图像颜色、亮度及尺寸均存在差异,因此需对样
本每个批次进行归一化处理,采用均值标准化的方法使样本值的取值范
围为
[0,1]
。
1.2卷积神经网络
卷积神经网络由输入层、卷积层、池化层、全连接层和输出层组成,卷
积层的本质是图像特征提取,因一层卷积提取到的特征往往是局部的,如
需提取的图像特征更全面,则需使用多层卷积。池化层是对卷积层的图像
特征进行降维,以简化网络复杂度和提取图像主要特征。池化操作一般采
用最大池化(max pooling)、平均池化(mean pooling)和重叠池化(over-
lapping pooling)等。全连接层(fully connected layers)的作用主要
是对特征图像计算每种类别的概率,从而实现图像分类识别。
VGG-Net
[1]
的泛化性能非常好,常用于图像特征的抽取目标检测候
选框生成等。VGG16是牛津大学VGG组提出的。VGG16相比AlexNet的一个改
进是采用连续的几个3x3的卷积核代替AlexNet中的较大卷积核(11x11,
5x5)。对于给定的感受野(与输出有关的输入图片的局部大小),采用堆积
的小卷积核是优于采用大的卷积核,因为多层非线性层可以增加网络深
度来保证学习更复杂的模式,而且代价还比较小(参数更少)。
1.3迁移学习
实验中研究对象是猴子小样本的数据集,若用大型网络自行训练会
造成过拟合效果,所以采用迁移学习训练样本集进行分类。迁移学习在分
类问题中应用广泛,是把已经学好的模型参数迁移到新的模型来帮助新
模型训练。从零开始训练CNN模型显然不是最实用的图像分类策略,若直
接使用少量数据训练,会导致模型过拟合或者欠拟合。迁移学习是解决深
度学习数据集稀少的常用方法。其一般过程为将模型在原领域进行一定
训练,使用目标域进行二次微调训练,原领域数据充足,目标域数据稀少,
提高了模型泛化能力
[2]
。
此次迁移学习过程为迁移学习加全连接层对数据集进行分类。通过
预训练好的深度卷积神经网络的模型,提取图片的特征向量并连接全连
接层,从而对卷积神经网络进型微调训练。在迁移学习提取的特征向量以
后连接全连接层,在实验过程中,学习率设置为0.0001,迭代10步,优化器
选择Adam,训练批次大小为16。
2实验结果与分析
2.1模型结果分析
将预处理后的训练集图片输入到基于迁移学习的VGG16网络模型
中,训练模型,获得训练效果。然后对验证集进行识别,得出准确率:
在saimiri_sciureus这类猴子的识别率可以达到100%,而在cebus_
capucinus这类猴子验证集中,其特征的面积较大,易于与肤色全白的猴
子和肤色全黑的猴子混淆,并且由于模型特征提取的能力主要受VGG16模
型结构的限制,提升空间不大,导致猴子的识别率受VGG模型所局限。
在训练普通CNN模型时,由于普通CNN模型需要从零开始训练,所以在
训练普通CNN模型的时候,需设置迭代50步,才能让普通CNN模型达到收敛
状态,然后将普通CNN模型与本模型进行对比发现,本模型的准确率可以
达到93.38%,高于普通CNN模型的74.26%。同时本模型还具有训练速度快
的特点,可以得出结论:基于迁移学习的VGG16网络模型识别精度优于CNN
模型,识别效果良好。
2.2 BN和Dropout对模型性能的影响
本文采用规范层和Dropout层,对比分析两者对模型性能的影响。在
网络的最后一个全连接层中修改Dropout层和批归一化函数(Batch Nor-
malization,BN),实验结果发现:
(1)使用Dropout层替换原来的规范层。虽然可以加快模型的训练速
度,但是使模型在验证集上的准确率下降了近2.5个百分点。
(2)在原来的模型上加上一个Dropout层对模型训练速度的几乎没有
影响,但是对模型的准确率略微有一些影响。所以将规范层在输出层之前
更为合理。
3结语
本文通过在训练好的VGG16网络模型上进行微调,实现小样本猴子图
像类别较为精准的分类,可为日常生活中的猴子鉴别提供一种切实有效
的办法,具有一定的现实意义。但是,目前对猴子图像的研究还存在很多
问题,比如标注信息少、数据集稀缺等,都会影响分类精度和速度,有很大
改进空间。不可否认的是,基于深度学习的图像分类方法将是未来研究的
主流方向。
(作者单位:华北理工大学理学院)
作者简介:刘洋,智能科学与技术专业。
参考文献
[1]Simonyan K,Zisserman A.Very 作者简介:Deep Convolutional
Networks for Large-Scale Image Recognition[J].Computer Sci-
ence,2014,66(11).
[2]白美丽.基于迁移学习的卷积神经网络服装图像分类[J].信息与
电脑(理论版),2019(14).
基于迁移学习的卷积神经网络小样本猴子图像分类
◎刘洋 赵佳亮 刘云庆
资源评论
- Anny2022-03-27用户下载后在一定时间内未进行评价,系统默认好评。
- qq_416230572023-11-05资源内容详细全面,与描述一致,对我很有用,有一定的使用价值。
- ADBRBDJXWK2022-10-25资源内容详细全面,与描述一致,对我很有用,有一定的使用价值。
数据资源
- 粉丝: 110
- 资源: 23万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功