为了获得 hljhjl,将输入的特征图 hl−1jhjl−1(j=1,2…Nl−1Nl−1)与相应的滤波器
wlijwijl 进行卷积,通过修正线性单元(rectified linear unit,ReLU)实现梯度下降及反向传
播
[15]
,将第 l 层的特征图表示如下:
hlj=Φ(∑j=1Nl−1hl−1j×wlij+bij)hjl=Φ(∑j=1Nl−1hjl−1×wijl+bji)
3) 池化层。在卷积层进行特征提取后,输出的特征图被传递至池化层进行特征选择
和信息过滤。池化层为采样特征映射层,通过降低特征的分辨率来防止过拟合。同时,能
实现减少网络参数,保持图像的平移、伸缩和旋转不产生变形。本文选用的池化模型
[19]
为:
Alk(i,j)=[∑x=1f∑y=1fAlk(S0i+x,S0j+y)p]1/pAkl(i,j)=[∑x=1f∑y=1fAkl(S0i+x,S0j+y)p]1/p
式中,步长 S
0
、像素(i,j)的含义与卷积层相同;p 为预指定参数。当 p=1 时,在池
化区域内取均值;当 p→∞时,在池化区域内取极大值。
1.2 金字塔池化结构的引入
FCN 最主要的优势是利用跳跃结构对不同池化层的结果进行采样,再通过优化这些
采样结果,得到精确分割结果。对具体目标检测或者分割任务来说,FCN 网络本身具有强
大的特征提取能力,但是其分割结果比较粗糙。
利用金字塔池化结构代替 FCN 中最后一层池化层,能够解决输入网络中图片尺寸固
定的限制,同时通过金字塔池化层,把上一层卷积层的特征图以不同尺度进行特征池化,
能增加算法的鲁棒性,提高识别精度。
1.3 CAFFE 深度学习框架的搭建
快速特征嵌入卷积结构(convolutional architecture for fast feature embedding,
CAFFE)是一个兼具表达性、速度和思维模块化的深度学习框架,支持多种类型的深度学
习架构,用于图像的分类和分割
[20-21]
。它是开源的框架,核心语言是 C++,支持命令行、
Python 和 Matlab 接口,既可以在中央处理器上运行,也可以在图形处理器上运行。
首先,基础层经过 CAFFE 深度学习框架的预训练模型和全卷积策略提取特征图层,
提取后的特征图层是输入影像的 1/8 大小,特征图层经过金字塔池化模块得到融合的带有
上下文整体信息的特征;然后,将池化前的特征图层与采样结果相连接;最后,经过卷积
层后得到最终输出结果。
2. 数据来源与实验方法
2.1 数据来源与样本选择
研究区影像是湖北省 2000 年、2005 年、2010 年 3 期 Landsat 5 TM 影像的 6 波段
数据,这些数据来源于地理空间数据云和美国国家地质勘查局网站。所选影像的成像时间
多为夏季,且云量少。对影像进行辐射定标、大气校正、镶嵌及裁剪等预处理操作后分幅
评论0
最新资源