基于深度学习的图像自动标注算法研究
本文研究了基于深度学习的图像自动标注算法,旨在提高图像标注的可靠性和效率性。该算法可以打破传统标注算法对图像视觉特征的依赖性,可以直接通过图像各像素点完成类别标注,处理效率更高。
深度学习图像自动标注算法的基本原理是通过算法来促使计算机模拟人脑处理事务流程,向其提供一个与人相似具有一定辨别事务的能力。想要实现基于深度学习的图像自动标注算法,需要对传统神经网络进行持续改进研究,形成层次更深的神经网络结构。
卷积神经网络作为多层网络结构,对于图像平移、旋转以及按比例缩放等形变敏感度低,利用其在进行图像标注时,能够更大程度上来抵抗外部因素的干扰。卷积层所含特征图个数与其所处层数成正比,所处层数越深,对应的特征图个数也就越多。
在模型结构设计中,选择应用RBM或DAE模型进行网络权重预训练,然后将预训练得到的各层权重值作为反向传播算法的权重初始值赋予整个神经网络,最后在利用反向传播算法对整个网络权重进行更新,以免网络算法求解过程中陷入到局部最优问题中。
本文主要对3层深度神经网络结构进行分析,向输入层单元内输入图像特征v,确定图像标签信息为网络输出节点t,应用RBM模型进行预训练,神经网络输入单元v∈RN(N表示输入图像特征为数),则可以确定应用GBRBm为深度神经网络第一层网络结构h1,两层应用常规RBM为深度网络第二层h2与第三层h3网络。
在卷积神经网络标注中,利用卷积神经网络来实现图像的自动标注,先对目标彩色图片进行灰度化处理,并利用双线性插值算法对图片进行缩放,最后转换成100×100模式。然后想S1层内输入处理后得到的数据,通过亚采样层S1层完成C1层特征图的采样,接着C2层继续卷积处理,共有12个特征图,卷积核尺寸不变,最后可以得到一个趋于理想的数值结果。
基于深度学习的图像自动标注算法可以提高图像标注的可靠性和效率性,对于互联网上每天会产生海量的图像与视频信息,进行可靠组织、查询与浏览动作具有重要意义。