YoloV8改进策略：CoordConv给卷积加上坐标，从而使其具备了空间感知能力.zip

共2个文件

zip：1个

pdf：1个

版权申诉

5星 · 超过95%的资源 106 浏览量 2024-02-21 06:50:08 上传评论 1 收藏 386.81MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

YoloV8改进策略：CoordConv给卷积加上坐标，从而使其具备了空间感知能力.zip （2个子文件）

YoloV8改进策略：CoordConv给卷积加上坐标，从而使其具备了空间感知能力

ultralytics-main.zip 386.61MB

YoloV8改进策略：CoordConv给卷积加上坐标，从而使其具备了空间感知能力.pdf 775KB

摘要

传统卷积具备平移不变性，这使得其在应对分类等任务时可以更好的学习本质特征。但是，当需要感知

位置信息时，传统卷积就有点力不从心了。为了使得卷积能够感知空间信息，作者在输入feature map

后面增加了两个coordinate通道，分别表示原始输入的x和y坐标，然后再进行传统卷积，从而使得卷积

过程可以感知feature map的空间信息，该方法称之为CoordConv。使用了CoordConv之后，能够使得

网络可以根据不同任务需求学习平移不变性或者一定程度的平移依赖性。

论文链接：https://arxiv.org/pdf/1807.03247.pdf

GitHub：https://github.com/uber-research/CoordConv

CoordConv的构造如下图所示：

与传统卷积相比，CoordConv就是在输入的feature map后面增加了两个通道，一个表示x坐标，一个表

示y坐标，后面就是与正常卷积过程一样了。

传统卷积具备三个特性：参数少、计算高效、平移不变性。而CoordConv则仅继承了其前两个特性，但

运行网络自己根据学习情况去保持或丢弃平移不变性。看似这会损害模型的归纳能力，但其实拿出一部

分网络容限能力去建模非平移不变性，实际上会提升模型的泛化能力。

事实上，如果CoordConv的坐标通道没有学习到任何信息，那么CoordConv此时就等价于传统卷积，具

备了传统卷积完全的平移不变性；而如果坐标通道学习到了一定的信息，那么此时CoordConv就具备了

一定的平移依赖性。可见，CoordConv的平移不变性和平移依赖性是可以根据不同任务进行动态调整

的。就像残差连接那样，即可以进行恒等映射，又可以多学习一部分内容。因此，我们完全可以在需要

感知空间信息的时候使用CoordConv，一方面增加不了多少计算量，另一方面对平移不变性也没有完全

消除，而是让网络根据任务的不同学习不同程度的平移不变性和平移依赖性。

本文将CoordConv加入到YoloV8中，我们一起看看效果如何？

Yolov8官方结果

YOLOv8l summary (fused): 268 layers, 43631280 parameters, 0 gradients, 165.0

GFLOPs

        Class   Images Instances   Box(P     R   mAP50

mAP50-95): 100%|██████████| 29/29 [

         all    230    1412   0.922   0.957   0.986 

 0.737

         c17    230    131   0.973   0.992   0.995 

 0.825

         c5    230     68   0.945     1   0.995 

 0.836

     helicopter    230     43    0.96   0.907   0.951 

 0.607

        c130    230     85   0.984     1   0.995 

 0.655

         f16    230     57   0.955   0.965   0.985 

 0.669

         b2    230     2   0.704     1   0.995 

 0.722

        other    230     86   0.903   0.942   0.963 

 0.534

         b52    230     70    0.96   0.971   0.978 

 0.831

        kc10    230     62   0.999   0.984    0.99 

 0.847

       command    230     40    0.97     1   0.995 

 0.811

         f15    230    123   0.891     1   0.992 

 0.701

        kc135    230     91   0.971   0.989   0.986 

 0.712

         a10    230     27     1   0.555   0.899 

 0.456

         b1    230     20   0.972     1   0.995 

 0.793

         aew    230     25   0.945     1    0.99 

 0.784

         f22    230     17   0.913     1   0.995 

 0.725

CoordConv（pytorch）代码

代码如下：

         p3    230    105    0.99     1   0.995 

 0.801

         p8    230     1   0.637     1   0.995 

 0.597

         f35    230     32   0.939   0.938   0.978 

 0.574

         f18    230    125   0.985   0.992   0.987 

 0.817

         v22    230     41   0.983     1   0.995 

  0.69

        su-27    230     31   0.925     1   0.995 

 0.859

        il-38    230     27   0.972     1   0.995 

 0.811

       tu-134    230     1   0.663     1   0.995 

 0.895

        su-33    230     2     1   0.611   0.995 

 0.796

        an-70    230     2   0.766     1   0.995 

  0.73

        tu-22    230     98   0.984     1   0.995 

 0.831

Speed: 0.2ms preprocess, 3.8ms inference, 0.0ms loss, 0.8ms postprocess per

image

class AddCoords(nn.Module):

 def __init__(self, with_r=False):

   super().__init__()

   self.with_r = with_r

 def forward(self, input_tensor):

   """

   Args:

     input_tensor: shape(batch, channel, x_dim, y_dim)

   """

   batch_size, _, x_dim, y_dim = input_tensor.size()

   xx_channel = torch.arange(x_dim).repeat(1, y_dim, 1)

   yy_channel = torch.arange(y_dim).repeat(1, x_dim, 1).transpose(1, 2)

   xx_channel = xx_channel.float() / (x_dim - 1)

   yy_channel = yy_channel.float() / (y_dim - 1)

   xx_channel = xx_channel * 2 - 1

   yy_channel = yy_channel * 2 - 1

   xx_channel = xx_channel.repeat(batch_size, 1, 1, 1).transpose(2, 3)

   yy_channel = yy_channel.repeat(batch_size, 1, 1, 1).transpose(2, 3)

   ret = torch.cat([

     input_tensor,

评论收藏

内容反馈

版权申诉

星云雨沫

2024-03-14

资源内容总结的很到位，内容详实，很受用，学到了~

AI浩

粉丝: 14w+
资源: 216

YoloV8改进策略：CoordConv给卷积加上坐标，从而使其具备了空间感知能力.zip

本科毕业设计：Python基于卷积神经网络的疲劳驾驶检测识别源码.zip

基于Python可视化的卷积神经网络的城市感知评估系统.zip

本科毕业设计：Python基于卷积神经网络的疲劳驾驶检测.zip

一种基于改进型YOLOv3卷积神经网络的夜间车辆检测方法.docx

matlab图像复原和图像增强技术：7 盲卷积算法对模糊噪声图像的恢复.zip

matlab图像专题：30 盲卷积算法对模糊噪声图像的恢复.zip

基于字符级卷积神经的中文情感分析.zip

基于深度学习改进YOLOv5算法的异常行为检测python源码+项目说明.zip

基于卷积神经网络的人脸识别系统.zip

2022年本科毕业设计源码：Python基于卷积神经网络的红外图像非均匀性校正.zip

时域卷积网络（TCN）案例模型,tcn时间卷积网络,Python源码.zip.zip

【AI人工智能】AI在医学领域的应用实战案例：基于3D卷积神经网络的结合口袋预测工具：DeepPocket.zip

用于整个幻灯片图像分类的稀疏卷积上下文感知.zip

MATLAB实现卷积神经网络并对图像进行特征提取（高分必看）.zip

基于卷积神经网络的蘑菇识别微信小程序.zip

卷积神经网络结合KNN算法学习实战源码+项目说明.zip

mxnet-CoordConv:MXNET坐标卷积的符号实现

基于textCNN卷积神经网络的英文新闻数据集分类(AG_news)算法源码.zip

YOLOv8-deepsort 实现智能车辆目标检测+车辆跟踪+车辆计数

YOLOv8网络结构图，自制visio文件，yolov8.vsds，需要的自取，在原有的基础上直接改就行了

yolov8(2023年8月版本),已经下好yolov8s.pt和yolov8n.pt

Transformer模型实现长期预测并可视化结果（附代码+数据集+原理介绍）

社交平台上经济类话题的文章热度信息，数据是真实的，但不是真实日期

行人跌倒数据集（VOC格式）

Unet眼底血管图像分割数据集+代码+模型+系统界面+教学视频.zip

全新的SOTA模型YOLOv9

YOLOV5 + 双目相机实现三维测距（新版本）

YOLOV5口罩检测数据集+代码+模型 2000张标注好的数据+教学视频.zip

pycharm连接autodl服务器（yolov8训练自己的数据集）

最新资源