即插即用篇 | YOLOv8引入局部自注意力 HaloAttention | 为参数高效的视觉主干网络扩展局部自注意力

本改进已集成到 YOLOv8-Magic 框架。

在这里插入图片描述

我们提出了Axial Transformers，这是一个基于自注意力的自回归模型，用于图像和其他组织为高维张量的数据。现有的自回归模型要么因高维数据的计算资源需求过大而受到限制，要么为了减少资源需求而在分布表达性或实现的便捷性上做出妥协。相比之下，我们的架构既保持了对数据联合分布的完全表达性，也易于使用标准的深度学习框架实现，同时在需要合理的内存和计算资源的同时，达到了标准生成建模基准测试的最先进结果。我们的模型基于axial attention，这是自注意力的一个简单泛化，自然地与张量的多个维度在编码和解码设置中对齐。值得注意的是，所提出的层结构允许在解码过程中并行计算大部分上下文，而不引入任何独立性假设。这种半并行结构极大地促进了甚至是非常大的Axial Transformer的解码应用。我们在ImageNet-32 和 ImageNet-64 图像基准测试以及BAIR Robotic Pushing视频基准测试上展示了Axial Transformer 的最先进结果。我们开源了Axial Transformers 的实现。

1 论文简介

自注意力因为参数独立的感受野缩放和内容依赖的交互作用，有望改善计算机视觉系统，这与参数依赖的缩放和内容独立的卷积交互形成对比。自注意力模型最近在精度与参数之间的权衡上显示出与基线卷积模型（如

即插即用篇 | YOLOv8引入局部自注意力 HaloAttention | 为参数高效的视觉主干网络扩展局部自注意力

1 论文简介

相关推荐

华为OD机试+OJ权限（Java/JS/Py/C/C++）

华为OD机试题库2024年

YoloV8最新改进手册——高阶篇

YOLOv8有效涨点专栏

YOLOv9有效涨点专栏

PCIe应用实战

二次开发快速入门

Qt Quick/QML入门到精通

hqchart高级应用教程

运动规划实战精讲

# openlayers综合教程300+

C++软件调试与异常排查从入门到精通系列教程

YOLOv8-Pose关键点检测

FFMPEG音视频系列文章

《GlobalMapper中文实战精品教程》

DEJA_VU3D - Cesium功能集（附源码）

故障诊断

龙芯loongarch64

YOLOv8-seg创新

YOLOv5/v7进阶实战

华为OD机试C卷+OJ（C++/Java/JS/Py）

OD机试 Py/Java/JS合集（A卷+B卷+C+D卷）

卫星导航

Google Play上架

TI毫米波雷达代码走读

Qt编程指南及车载IVI中控实践开发~从入门到进阶

★教程3:Simulink入门60例

# leaflet综合教程150+

数据科学分析（Matlab/Python）

GEE教程训练