没有合适的资源?快使用搜索试试~ 我知道了~
上下文信息融合与分支交互的SAR图像舰船无锚框检测.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 39 浏览量
2023-02-23
20:09:39
上传
评论
收藏 979KB DOCX 举报
温馨提示
试读
12页
上下文信息融合与分支交互的SAR图像舰船无锚框检测.docx
资源推荐
资源详情
资源评论
1. 引言
海面舰船目标的检测在海运管制、渔业管理和军事监控等领域有着重要的现实意义
[1]
。不同于红外、光学等被动式成像传感器,合成孔径雷达(Synthetic Aperture Radar, SAR)
利用主动式微波遥感技术,可在全天时、全天候条件下获取高分辨率遥感图像
[2]
,因此,
利用 SAR 技术实现对舰船目标检测是 SAR 图像解译领域的研究热点。由于 SAR 图像中小
尺寸舰船居多,且在海陆交接近海岸区域,受背景杂波、相邻区域类似目标散射的影响,
舰船的目标提取和检测仍然存在很大的困难。
经典的 SAR 图像目标检测方法多采用恒虚警率(Constant False Alarm Rate, CFAR)及其
衍生算法
[3]
,预先对海杂波分布建立统计模型,利用舰船本身与海洋背景之间的特征差异
进行检测。CFAR 检测算法高度依赖人工设计滑窗,算法泛化能力弱,海杂波分布模型建
立过程复杂,使得其针对复杂场景的 SAR 图像目标检测效果不理想。近年来,基于卷积神
经网络(Convolutional Neural Network, CNN)的目标检测方法开始应用于 SAR 图像目标检测
领域。该类方法利用标注的数据集训练网络,提取深度的舰船特征,不受 SAR 图像场景的
限制,检测模型具有准确率高、鲁棒性强的特点。海军航空大学的 Li 等人
[4]
构建了国内首
个公开 SAR 舰船数据集(SAR Ship Detection Dataset, SSDD),并采用多层特征融合、迁移
学习的方式优化 Faster R-CNN
[5]
检测方法,在该数据集上取得了 78.8%的平均精度。Jiao 等
人
[6]
提出了基于稠密连接网络的多尺度检测算法,将不同层次的特征自上至下密集连接,
使高层语义信息融合进每个低层特征中,舰船检测性能得到明显提升。胡昌华等人
[7]
基于
YOLOv3 检测框架,利用改进的特征金字塔网络(Feature Pyramid Networks, FPN)
[8]
,提高了
小尺寸舰船的检测效果。Cui 等人
[9]
提出了将注意力机制嵌入至 FPN 中,同时使用密集连
接的方式,在复杂场景下取得了不错的检测效果。
相比于传统方法,基于 CNN 的检测方法在性能上的确有很大的提升。但是,以上
CNN 算法都是基于锚框(anchor-based)的检测方法,其网络参数和锚框的比例是针对目标密
集的可见光图像而设定的,而 SAR 图像中舰船目标分布稀疏,锚框机制生成大量非目标的
检测框,造成内存的占用和计算量的增加,从而制约检测速度。因此,本文尝试将无锚框
(anchor-free)算法用于 SAR 图像舰船检测。将无锚框算法直接应用于 SAR 图像中,依然存
在两个问题:(1) 受 SAR 成像原理的影响,图像中舰船尺寸各异,目标存在漏检问题;(2)
背景复杂的 SAR 图中,近岸区域的舰船被沿岸建筑干扰,造成检测框无法包含完整的目
标。
针对这些问题,本文提出了上下文信息融合(context fusion)与分支交互(interacting
branch)的 SAR 图舰船无锚框检测算法,命名为 CI-Net。提出的上下文信息融合模块,采用
自底向上的模式,利用高层语义信息引导低层特征融合,对融合后的特征做上下文信息提
取,得到信息丰富的待检测特征层。采用自注意力模块建立相互作用的分支结构,利用强
调目标位置的分类分支指导回归分支优化检测框,输出定位精准的检测结果。
2. 无锚框检测模型
针对自然场景的目标检测,研究者常用基于锚框的检测模型,不管是单阶段的
SSD
[10]
、YOLO 系列
[11]
,还是双阶段的 Faster R-CNN 等算法,都取得了不错的检测性能,
是当前主流的检测模型。但 SAR 图像中的舰船目标分布稀疏,锚框的设计会引入无舰船的
背景框,导致正负训练样本的不均衡问题
[12]
;其次大量无用的锚框浪费内存资源和计算时
间,对检测速度造成影响。相对而言,无锚框的检测算法更适用于 SAR 图像检测,例如
CenterNet
[13]
, FCOS
[14]
等算法,根据目标特征形状、关键点生成稀疏的检测框,摆脱了锚
框机制的制约,使得网络参数大幅减少,检测速度是很可观的。无锚框的检测模型如图 1
所示。
图 1 无锚框的检测模型
下载: 全尺寸图片 幻灯片
以 FCOS 算法为例,无锚框的检测算法分为 3 阶段:首先是特征提取阶段,选用合适
的主干网络提取图像中的目标特征,获取到多尺度特征图。第 2 阶段,以逐像素点预测的
方式,对目标框中的所有像素点进行边界框标定,直接在特征图中回归预测目标的位置。
在最后的检测头阶段,分别输出分类分支、回归分支、中心点分支 3 个分支,中心点的值
表示当前像素点偏离真值框中心的程度,中心点值越大,代表当前像素点越接近目标正中
心。利用中心分支可以优化分类和回归分支,保留高质量的检测框作为最终的结果。考虑
到 SAR 图像舰船分布稀疏的特点,以及检测模型的实时性要求,本文选择将无锚框的检测
算法应用于 SAR 图像的舰船检测。
3. CI-Net 检测模型
将 FCOS 无锚框的检测算法直接用于 SAR 图像舰船检测,仍然存在一些问题:首
先,该算法针对的是多类别目标检测,对语义信息的依赖程度高,所以 FCOS 在特征金字
塔中添加了更深层的网络,获取语义信息丰富的深度特征,深度特征层是由网络连续降采
样获得的,其分辨率低,目标的空间信息缺少,然而 SAR 图像中小尺度舰船居多,存在小
目标漏检现象。其次,SAR 图像中的目标是后向电磁波辐射成像,在近海岸区域,舰船目
标同岸上建筑会表现出相似的辐射特性,算法很难对背景和目标进行判别,造成这些区域
检测框的定位不准确。因此,本文在 FCOS 算法模型的基础上,提出了上下文信息融合与
分支交互的无锚框检测算法 CI-Net,检测模型框架如图 2 所示。
图 2 CI-Net 检测模型框架
下载: 全尺寸图片 幻灯片
CI-Net 检测模型包括特征提取阶段、上下文融合模块以及多任务检测头。首先将 SAR
图像输入主干网络 ResNet_101 中进行特征提取,特征层{C3, C4, C5}分别获取的是
ResNet_101 中 Conv3_x, Conv4_x, Conv5_x 的最后一层特征。然后将{C3, C4, C5}在特征金
字塔网络中进行高低层特征融合,得到{P3, P4, P5, P6}4 个融合特征层,融合特征层通道数
均为 256。不过融合后的高层特征仍存在分辨率低、空间信息丢失的问题,并不利于 SAR
图像中的舰船检测。模型设计了上下文融合模块,采用自底向上的方式,将底层特征与高
层上采样后的特征融合,得到一层与 P3 层分辨率一致、包含空间信息与语义信息的融合
特征,并将其送入检测头中实现最后的检测。在检测头阶段,保留了 FCOS 算法原有的 4
次卷积,得到共享的待检测特征,输出分类(classification)、回归(regression)、交并比
(Intersection Over Union,IOU)3 个分支,分类分支可以指引回归分支对目标框进行修正,
经过自注意力机制之后微调检测模型,输出最好的检测结果。
3.1 上下文融合模块
CNN 被用来提取图像的特征信息,低层特征有较高的分辨率,空间细节信息丰富却
缺少语义信息,语义信息的缺少导致目标漏检。FPN 基于特征融合的思想,采用自顶向下
的方式,将高层语义信息融入较低的层级中,实现低层特征语义信息的填充。然而经过
FPN 特征融合之后的特征层表现出不平衡状态,高层特征仍然缺少空间信息
[15]
,针对二分
类的 SAR 图像舰船检测任务,本文提出了上下文融合模块,将语义信息和空间信息融合,
再经过上下文信息提取,丰富特征层的信息表达。上下文融合模块如图 3 所示。
剩余11页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 4029
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功