没有合适的资源?快使用搜索试试~ 我知道了~
结合空洞卷积的FuseNet变体网络高分辨率遥感影像语义分割.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 30 浏览量
2022-11-29
17:40:44
上传
评论
收藏 1.81MB DOCX 举报
温馨提示
试读
16页
结合空洞卷积的FuseNet变体网络高分辨率遥感影像语义分割.docx
资源推荐
资源详情
资源评论
遥感影像语义分割是遥感影像信息获取的关键环节,也是近年来的研究热点,相关研
究成果已广泛应用于土地利用变化检测、交通监测和灾害预警评估等方面
[1]
。高分辨率遥
感影像能够表现丰富的地物信息,有利于提取地物的复杂特征以识别复杂的人造目标。
传统的遥感图像语义分割主要是通过提取图像的低级特征进行分割,分割结果缺乏语
义标注。文献[2]通过随机森林分类器提取语义特征进行语义分割。文献[3]利用 Logistic 回
归分类器提取颜色、纹理特征,通过条件随机场(conditional random field,CRF)模型
训练实现语义分割。然而,传统的遥感图像语义分割方法对特征的提取和表达,需要依靠
先验知识进行人工选择和设计,并且在建立相应语义分割模型的过程中,人工设计的特征
和高层语义特征之间存在差距,因此建立的语义分割模型泛化能力较差。
随着深度学习理论的发展与普及,深度神经网络模型已广泛应用于不同行业
[4]
。研究
者在遥感影像分析处理中应用深度学习方法,取得了较为理想的效果
[5-6]
。全卷积网络
[7]
(fully convolutional networks,FCN)和 SegNet 网络
[8]
在高分辨率遥感影像语义分割中
展现出了较为优异的性能与分割效果,但 FCN 对像素进行分类时没有考虑到像素之间的
关系,忽略了基于像素分类的空间规划步骤,缺乏空间一致性。SegNet 的基本网络结构
为编码器-解码器,编码器对图像进行高维特征提取和下采样,解码器对提取的特征图进行
上采样操作,因此编码器-解码器结构可以以 1∶1 的分辨率进行像素预测,但上采样的过
程中易丢失细节信息,使得小目标地物的分割效果较差。文献[9]分别提取红绿蓝(red
green blue,RGB)信息和数字地表模型(digital surface model,DSM)信息,并将它们
融合集成到 SegNet 结构中进行语义分割,获得高分辨率的多模态预测 RGB-DSM 数据用
于异构数据源的联合学习。然而该融合策略无法平衡高程信息和颜色信息,导致图像分割
不准确。因此,本文针对高分辨率遥感影像中多模态数据融合效果不佳、边缘分割效果不
理想、类边界模糊和易产生误分割现象等问题,受编码器-解码器和文献[6]中 FuseNet 网
络结构的启发,对 FuseNet 网络结构进行改进,提出了一种结合空洞卷积的 FuseNet 变
体网络(improved FuseNet with atrous convolution-convolutional neural network,IFA-
CNN)模型。在编码器部分,提出虚拟融合单元来提高遥感影像语义分割效果;针对遥感
影像提取特征部分,引入空洞卷积调整感受野捕获遥感影像多尺度信息,提高目标分割效
果;在解码器部分,链接编码器并提取融合特征,以提高网络鲁棒性。
1. 高分辨率遥感影像语义分割模型
1.1 多模态遥感数据融合
文献[10]中,FuseNet 采用了编码器-解码器结构将二维图像数据融合。FuseNet 架构
如图 1 所示,其中,pooling 为池化操作,conv 为卷积操作,unpooling 为反池化操作,
IRRG 为近红外、红外和绿波段,Ⓒ为融合操作。图 1 中使用了两个编码器对 RGB 和
DSM 进行联合编码,首先将编码后的特征图输入到解码器中进行上采样,然后由分类器进
行弱分类,通过 softmax 得到最终分割结果。同时,FuseNet 选择深度信息作为辅助特征
进行多模态数据融合,如图 2(a)所示,其中,aux 为辅助分支,main 为主分支,mix
为虚拟融合操作。但 FuseNet 在进行多模态数据融合时,DSM 分支与 RGB 分支存在不对
称,使得 DSM 分支仅提取深度特征,RGB 分支需要提取 DSM 与 RGB 数据的融合。此
外,这种不对称的融合方案导致在解码过程中只使用主分支编码时的索引进行上采样,在
一定程度上会影响遥感影像的分割效果。
图 1 用于遥感数据融合的 FuseNet 架构
[9]
Figure 1. FuseNet Architecture for Fusion of Remote Sensing Data
[9]
下载: 全尺寸图片 幻灯片
图 2 多模态数据融合策略
Figure 2. Multimodal Data Fusion Strategy
下载: 全尺寸图片 幻灯片
为了更好地提取 RGB-DSM 图像的特征,解决主数据源及辅助数据源数据分配不均的
问题,本文提出了一种虚拟分支融合单元,对主数据源和辅助数据源进行一次卷积运算,
从而产生一种虚拟模态。将该虚拟模态作为融合数据源之一,将 DSM 分支提取的特征和
RGB 分支提取的特征进行融合。如图 2(b)所示,通过这种方法调整 FuseNet 结构,使
其在一定程度上可以解决对主数据源和辅助数据源进行选择的问题,以解决数据处理不均
衡的问题。另外,为解决解码过程中只使用主分支编码时产生的索引进行上采样的问题,
本文将虚拟分支融合单元中最大池化操作产生的索引应用于解码阶段的上采样,从而提高
语义分割的精度。
1.2 多尺度空洞卷积
空洞卷积
[11]
是在不减少图像尺寸的同时获得比较大的感受野,所以其主要优势在于允
许灵活地调整感受野的大小来捕获多尺度信息,提高多目标分类和分割任务的性能
[12]
。二
维空洞卷积算子定义为:
gi,j(x𝓁)=∑c=0C𝓁θk,ri,j*x𝓁c ]]>
式中,g
i,j
是对输入特征图的卷积操作
RH𝓁×W𝓁×C𝓁→RH𝓁+1×W𝓁+1RH𝓁×W𝓁×C𝓁→RH𝓁+1×W𝓁+1;*表示卷积算子;
x𝓁∈RH𝓁×W𝓁×C𝓁x𝓁∈RH𝓁×W𝓁×C𝓁为在第 i 行和第 j 列中属于通道 c∈{0, 1,2…C𝓁}c∈{0,
1,2…C𝓁}的特征图;θk,rθk,r 为卷积核大小为 k 和扩张率为 r∈Z+r∈Z+的空洞卷积。在空
洞卷积中,卷积核大小 k 增加为 k+(k-1)(r-1),当 r=1 时,空洞卷积相当于标准卷
积。标准卷积的卷积层感受野与之前所有层卷积核的大小和步长有关,感受野呈线性增
长,而空洞卷积感受野为(2
r+1
-1)×(2
r+1
-1),因此空洞卷积的级联可以实现感受野呈
指数增长,使得每个卷积输出都包含较多的信息。
2. 结合空洞卷积的 FuseNet 变体网络
本文使用编码器-解码器作为基本网络结构,如图 3 所示。编码器-解码器是一种输出
近似于输入的网络结构。因此,在影像分割阶段,原始图像分辨率与分割图像分辨率保持
一致。解码器能够使用反池化操作对特征图进行上采样,因此可使输出图像分辨率逼近输
剩余15页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3643
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于opencv+yolov8实现目标追踪及驻留时长统计源码.zip
- 水稻病害基于Yolov8算法优化目标检测识别与AI辅助决策python源码+模型+使用说明.zip
- 海尔618算价表_七海5.20_16.00xlsx(1)(2).xlsx
- WebCrawler.scr
- 【计算机专业毕业设计】大学生就业信息管理系统设计源码.zip
- YOLO 数据集:8种路面缺陷病害检测【包含划分好的数据集、类别class文件、数据可视化脚本】
- JAVA实现Modbus RTU或Modbus TCPIP案例.zip
- 基于YOLOv8的FPS TPS AI自动锁定源码+使用步骤说明.zip
- JAVA实现Modbus RTU或Modbus TCPIP案例.zip
- 基于yolov8+streamlit的火灾检测部署源码+模型.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功