【免费】语义分割1_最新语义分割网络总结资源-CSDN文库

需积分: 0 71 浏览量更新于2022-08-08 收藏 485KB DOCX 举报

【语义分割1】实验是深度学习领域中的一个重要任务，主要目标是对输入图像的每个像素进行分类，输出每个像素所属的类别。语义分割在自动驾驶、遥感图像分析、医疗影像诊断等领域有广泛应用。本实验中，采用了两种基于深度学习的模型：全卷积网络（FCN）和结合了空洞空间金字塔池化（ASPP）的ResNet18。全卷积ResNet18-FCN是将经典的ResNet18网络修改为适合语义分割任务的形式。传统的ResNet18网络包含全局池化层和全连接层，但在FCN中，这些层被移除，转而使用1x1卷积层来减少通道数，然后通过上采样层恢复到原始图像的分辨率，使得模型能对每个像素进行预测。ResNet18-FCN的输出特征图的通道数与像素类别数相等，从而实现像素级别的分类。 ASPP（Atrous Spatial Pyramid Pooling）是针对上下文信息建模的一种方法，尤其适用于处理语义分割任务。在ResNet18-ASPP模型中，ResNet18的最后层被替换为ASPP模块。ASPP模块包括并行的空洞卷积层和图像池化层，空洞率（dilation）的不同使得模型能捕获不同尺度的信息。空洞卷积通过在滤波器中插入空洞（0填充）来扩大感受野，而不增加计算复杂度。ASPP模块的输出会被整合，通过1x1卷积调整通道数，然后上采样得到最终的预测图。实验中，两个模型都在Pascal VOC数据集上进行训练和验证，图像尺寸统一调整为480x480，以减少计算资源需求。模型训练完成后，会在验证集上评估性能。值得注意的是，实验还提供了结合Transformer Block的选项，Transformer结构在处理序列数据时表现出色，能够捕捉长距离依赖，但在这里并未详细描述如何集成到语义分割模型中。总结来说，语义分割1实验的核心是将ResNet18网络转化为适合语义分割的架构，通过全卷积和ASPP模块来提取和融合多尺度信息，从而实现对图像像素级别的精细分类。实验不仅要求模型的准确性，同时也关注模型的效率和计算资源的使用。在实践中，预训练模型的使用可以加速训练过程并提高模型性能。

实验三语义分割

一、实验要求

使用基于深度学习的方法全卷积网络（Fully Convolution Network，FCN）在 Pascal VOC

训练集上进行训练，然后将训练后的模型在 Pascal VOC 验证集上进行测试。为了减小所需

的计算资源，训练时统一使用 480x480 的图片尺寸。

此外，使用的深度模型包括：

1) 一个使用 ResNet-18 作为骨干网络的 Output Stride=16 的 FCN，即将 ResNet 最后

一个 stage 的下采样层去掉、卷积层的 dilation 设置为 2；

2) （与第三点二选一）基于上述的 FCN，结合至少一种课上提到的、对上下文语境建

模（Context Modeling）的方法，例如 ASPP、PPM 等；

3) （与第二点二选一）基于上述的 FCN，结合 Transformer Block 的方法。

二、实验原理

语义分割，即给定一张输入图像，利用模型输出该图像上每一个像素对应的类别预测或

者属于某一类别的概率。由于该任务需要对每个像素都进行预测，语义分割又被称作稠密预

测任务（Dense Prediction）。不同于图像分类只需对整张图片输出一个概率分布向量，语义

分割中需要对图片中的所有像素都生成一个与之对应的概率分布向量，因此要求模型最终输

出的特征图与输入图像具有相同的分辨率，并且具有与像素所属类别数同样多的通道数。

本次实验采用两个模型完成语义分割任务（即“实验要求”中的“1)”和“2)”），分

别是下采样率为 32 的全卷积 ResNet18 模型（记作 ResNet18-FCN），和结合了 ASPP 的

ResNet18（记作 ResNet18-ASPP）。

1. 全卷积 ResNet18

全卷积 ResNet18（ResNet18-FCN）的基本设计与原版 FCN

相同，只是

中使用 VGG 作

为卷积网络，而此处我们将其替换为 ResNet18。

相比于标准 ResNet18，ResNet18-FCN 去掉了其最高层的全局池化和全连接层，用一个

1x1 卷积和一个 32 倍上采样层取而代之。其中 1x1 卷积用于将 512 通道的特征图转换为 N

通道（N 为像素的类别数），而上采样层用于将特征图的分辨率恢复到与原输入图像相同，

以进行稠密预测。

图 1.1 ResNet18-FCN 的构建细节

下载后可阅读完整内容，剩余4页未读，立即下载

资源推荐

资源评论

设计师马丁

粉丝: 21
资源: 299

语义分割1

MATLAB图像语义分割实例（道路语义分割）

深度卷积网络CNN与图像语义分割1

halcon语义分割标注工具.zip

遥感语义分割代码

汽车结构语义分割数据集

FCN语义分割PPT课件.pptx

语义分割源代码

VOCdevkit语义分割数据集.zip

语义分割结果可视化（原图+语义掩码+图例）

Yolo 语义分割Semantic Segmentation代码修改及训练全纪录 - Artyze的博客 - CSDN博客.pdf

LiteSeg语义分割 C++ 模型部署

Pytorch下实现Unet对自己多类别数据集的语义分割

使用MATLAB深度学习进行语义分割

语义分割评价指标代码实现-Python

ECCV 2020语义分割相关文章41篇

深度学习用于语义分割

基于卷积神经网络特征和改进超像素匹配的图像语义分割1

深度学习语义分割

最新版ISO/IEC 27001:2022、ISO 27002:2022中英文合集

BurpLoaderKeygen.jar.zip

Chrome Header Editor 插件

Goby红队版-win-x64-2.4.7版本

软件工程导论(第六版)课后习题答案1

OpenVAS GVM 中文翻译补丁

安全认证cisp教材全套

STM32F103C8T6核心板-电路原理图1.PDF

OpenVAS离线资源

最新资源