【免费】目标检测论文集1资源-CSDN文库

需积分: 0 23 浏览量 2022-08-04 14:21:32 上传评论收藏 750KB PDF 举报

资源详情

资源评论

资源推荐

深度学习目标检测

2020 年 9 月 7 日

摘要

计算机视觉研究中，目标检测是一个比分类更困难的领域，我们将回顾它的历史和最近的发展。在深度学习时代之前，像

HOG 和特征金字塔这样的手工特性被广泛用于获取图像中的定位信号。然而，这些方法通常不能很好地扩展到通用的目标

检测，所以大多数的应用仅限于人脸识别或者行人检测。利用深度学习的力量，我们可以训练一个网络来学习要获取的特征，

并预测目标的坐标。这最终带来了基于视觉感知的应用的繁荣，比如商业人脸识别系统和无人机。在这篇文章里，我为那些

想要学习目标检测的新手挑选了 12 篇必读论文。尽管构建目标检测系统最具挑战性的部分隐藏在实现细节中，但是阅读这些

论文仍然可以让你对这些想法的来源以及未来目标检测将如何发展有一个很好的大致理解。作为阅读本文的前提条件，你需

要了解卷积神经网络的基本思想，以及常用的优化方法，如带反向传播的梯度下降法。还有图像分类的基础知识，因为目标

检测的许多很酷的想法都来源于更基础的图像分类研究。

https://towardsdatascience.com/ 12-papers-you-should-read-to-understand-object-detection-in-the-deep- learning-

era-3390d4a28891

1 2013：OverFeat

OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks

在 2012 年的 ImageNet 竞赛中，基于 CNN 特征提取的 AlexNet 击败了所有手工设计的特征提取器。受到 AlexNet 成

功的启发，OverFeat 迅速将 CNN 引入到目标检测领域。这个想法非常直接: 如果我们可以用 CNN 对一张图片进行

分类，那么用不同大小的窗口滑动浏览整张图片，然后尝试用 CNN 逐一对它们进行分类呢？该算法利用了 CNN 的特

征提取和分类能力，并通过预定义的滑动窗口绕过了硬 region proposal 问题。另外，由于邻近的卷积核可以共享部分

计算结果，因此不需要计算重叠区域的卷积，从而大大降低了成本。OverFeat 是单阶段目标检测器的先驱。它试图在

同一个 CNN 中结合特征提取、位置回归和区域分类。不幸的是，这种单阶段的方法由于使用较少的先验知识，精确度

也相对较差。因此，OverFeat 未能引领单阶段检测器研究的热潮，直到两年后出现了一个更优雅的解决方案。

在上图中，R-CNN 首先使用一种称为 selective search 的技术从输入图像中提取出感兴趣的潜在区域。selective search

并不真正尝试理解前景目标，相反，它依靠启发式方法对相似的像素进行分组: 相似的像素通常属于同一个目标。因此，

selective search 的结果很有可能包含一些有意义的内容。接下来，R-CNN 将这些 region proposals 变换成带有一些填

充的固定大小的图像，并将这些图像提供给网络的第二阶段，以便进行更细粒度的识别。与那些使用 selective search

的旧方法不同，R-CNN 在第二阶段将 HOG 替换为 CNN，从所有 region proposals 中提取特征。这种方法需要注意的

是，许多 region proposals 实际上并不是一个完整的目标，因此 R-CNN 不仅需要学习如何对包含的类别进行分类，还

需要学习如何拒绝负类。为了解决这个问题，R-CNN 将所有与一个 ground truth 框重叠度 �0.5 IoU 的 region proposal

视为正，其余视为负。selective search 的 region proposal 高度依赖于相似性假设，因此只能提供大致的位置估计。为

了进一步提高定位精度，R-CNN 借鉴了“Deep Neural Networks for Object Detection”(又名 DetectorNet) 的思想，

引入了额外的边界框回归来预测框的中心坐标、宽度和高度。这种回归器被广泛应用于未来的目标检测器中。然而，像

R-CNN 这样的两阶段检测器存在两个大问题: 1) selective search 并不是卷积，因为它不是端到端可训练的。2) region

proposal 阶段与 OverFeat 等其他单阶段检测器相比通常非常慢，而且在每个 region proposal 上分别运行会使其更慢。

稍后，我们将看到 R-CNN 如何随着时间的推移逐步演变以解决这两个问题的。

2 R-CNN 基于区域卷积网络的精确目标检测和分割

R-CNN 也是在 2013 年提出的，比 OverFeat 晚了点。然而，这种基于区域的方法最终以其两阶段的框架，即 region

proposal 阶段和区域分类与精细化阶段，引发了目标检测研究的大浪潮。

图 1: 源自论文“Region-based Convolutional Networks for Accurate Object Detection and Segmentation”

在上图中，R-CNN 首先使用一种称为 selective search 的技术从输入图像中提取出感兴趣的潜在区域。selective search

并不真正尝试理解前景目标，相反，它依靠启发式方法对相似的像素进行分组: 相似的像素通常属于同一个目标。因此，

selective search 的结果很有可能包含一些有意义的内容。接下来，R-CNN 将这些 region proposals 变换成带有一些填

充的固定大小的图像，并将这些图像提供给网络的第二阶段，以便进行更细粒度的识别。与那些使用 selective search

的旧方法不同，R-CNN 在第二阶段将 HOG 替换为 CNN，从所有 region proposals 中提取特征。这种方法需要注意的

是，许多 region proposals 实际上并不是一个完整的目标，因此 R-CNN 不仅需要学习如何对包含的类别进行分类，还

需要学习如何拒绝负类。为了解决这个问题，R-CNN 将所有与一个 ground truth 框重叠度 �0.5 IoU 的 region proposal

视为正，其余视为负。selective search 的 region proposal 高度依赖于相似性假设，因此只能提供大致的位置估计。为

了进一步提高定位精度，R-CNN 借鉴了“Deep Neural Networks for Object Detection”(又名 DetectorNet) 的思想，

引入了额外的边界框回归来预测框的中心坐标、宽度和高度。这种回归器被广泛应用于未来的目标检测器中。然而，像

R-CNN 这样的两阶段检测器存在两个大问题: 1) selective search 并不是卷积，因为它不是端到端可训练的。2) region

proposal 阶段与 OverFeat 等其他单阶段检测器相比通常非常慢，而且在每个 region proposal 上分别运行会使其更慢。

稍后，我们将看到 R-CNN 如何随着时间的推移逐步演变以解决这两个问题的。

3 2015: Fast R-CNN

R-CNN 的一个快速后续是减少对多个 region proposals 的重复卷积。由于这些 region proposals 都来自一个图像，自

然而然地想到，可以通过对整个图像运行一次 CNN，并在许多 region proposals 之间共享计算，来改进 R-CNN。然

而，不同的 region proposals 有不同的大小，如果我们使用相同的 CNN 特征提取器，会导致不同的输出特征图大小。

这些具有不同大小的特征图将阻止我们使用全连接层进行进一步的分类和回归，因为全连接层的输入只能是固定大小。

幸运的是，论文“Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition”解决了全连接层

的动态缩放问题。在 SPPNet 中，在卷积层和 FC 层之间引入了特征金字塔池化，以创建 bag-of-words 式的特征向量。

这个向量有固定的大小和不同尺度的特征特征，所以我们的卷积层现在可以接受任意尺寸的图像作为输入，而不用担

心 FC 层的不兼容性。受此启发，Fast R-CNN 提出了一个类似的层称为 ROI Pooling 层。这个池化层将不同大小的

特征图 downsample 为一个固定大小的向量。这样我们就可以使用相同的 FC 层进行分类和框回归，不管 ROI 是大还

是小。

Fast R-CNN 由于采用了共享特征提取器和尺度不变（scale-invariant）的 ROI 池化层，达到类似的定位精度，训练快

了 10 20 倍，且推理快了 100 200 倍。接近实时推理和一个更易用的端到端检测部分训练协议使 Fast R-CNN 成为

业界的热门选择。

剩余14页未读，继续阅读

评论收藏

内容反馈

实在想不出来了

粉丝: 24
资源: 318

目标检测论文集1

评论0

最新资源

目标检测论文集1

评论0

目标检测论文集.rar

correlation filter目标跟踪论文集--第一部分

object-detection-papers:物体识别与检测相关论文集

目标检测深度学习神经网络经典论文集

目标追踪论文集（下）

经典目标检测论文合集

目标检测论文合集

人工智能基于深度学习论文大合集比如：基础目标分类论文、目标检测论文、面部表情识别论文等等848MB资源包.zip

ECCV2018目标检测论文

头部检测论文集

边缘检测论文集，收集了边缘检测发展历程的重要论文

无监督异常检测论文集

无监督异常检测论文集.zip

correlation filter目标跟踪论文集--第二部分

经典目标检测论文RCNN翻译

基于YOLOv5实现垃圾分类目标检测

ACL 2020 论文——谣言检测_FakeNewsDetection_目标检测_GCAN_谣言_谣言检测_

correlation filter目标跟踪论文集--第三部分

personality-prediction:在各种著名的人格数据集上使用语言模型和心理语言特征进行自动人格检测的实验，包括论文集（标有“大五”的人格特征）

fraud-detection-papers:欺诈检测的研究和调查论文集，主要涉及广告

移动机器人障碍物检测论文集锦

论文研究-基于似物目标的快速行人检测算法.pdf

论文研究-基于全局颜色对比的显著性目标检测.pdf

CVPR-2018论文合集六

CVPR-2018论文合集八

CVPR-2018论文合集二

最新资源