非特定类型图像前景分割解决方案
一 前言
近年来,语义分割在人像分割上表现突出,但语义分割本质上是图像像素级
分类,对特定类别表现较优,但对非特定类别语义分割的执行效果并不令人满意。
因此在本任务中为实现非特定类别图像分割,采用基于显著性的图像分割算法,
提出本项目的核心显著性分割模型 U
2
GE-Net。其基于 U
2
-Net(CVPR2020)算法进
行改进,采用全局上下文嵌入模块来聚合通道信息,引入门控通道注意力模块
(GCT)(CVPR2020),重新设计损失项(增加了边缘 loss 和 IoUloss(交并比损
失)),完成了推理速度快,可移植性强等要求
图 1.1 U
2
GE-Net 结构图
二 创意描述
(1) 主体定义明确:采用 GCT 深度卷积神经网络视觉识别转化单元,增强
模型对图像前景的注意力。该单元可以由三部分构成,第一部分通过
全局上下文嵌入模块聚合各个通道中的全局上下文信息;第二部分采
用与第一部分相似的方式使用 l
2
范数进行规范化,实现通道归一化;
第三部分,通过门控机制引入权重γ与门控偏置β,促进神经元的竞
争及协同
(2) 边缘分割准确:设计边缘 loss,IoUloss 和全局 loss 指导整个网络优
化。全局 loss 采用 BCEloss 对 mask(掩膜)和 ground truth(真实
值)进行计算;边缘 loss 分别对 mask 和 ground truth 使用 canny
评论0