没有合适的资源?快使用搜索试试~ 我知道了~
SIGAI1012-目标检测算法综述1
需积分: 0 0 下载量 180 浏览量
2022-08-03
19:40:40
上传
评论
收藏 1.55MB PDF 举报
温馨提示
试读
18页
介绍。(1)区域选择:这一步是为了对目标的位置进行定位。由于目标可能出现在图像的任何位置,而且目标的大小、长宽比例也不确定,所以最初采用滑动窗口的策略对整幅图像
资源详情
资源评论
资源推荐
目标检测算法综述
Sigai 特约作者:东尼大佬
2018.10.12
原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,
不能用于商业目的。
导言
目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能
视频监控、工业检测、航空航天等诸多领域,通过计算机视觉减少对人力资本的消耗,具有
重要的现实意义。因此,目标检测也就成为了近年来理论和应用的研究热点,它是图像处理
和计算机视觉学科的重要分支,也是智能监控系统的核心部分,同时目标检测也是泛身份识
别领域的一个基础性的算法,对后续的人脸识别、步态识别、人群计数、实例分割等任务起
着至关重要的作用。由于深度学习的广泛运用,目标检测算法得到了较为快速的发展,本文
广泛调研国内外目标检测方法,主要介绍基于深度学习的两种目标检测算法思路,分别为
One-Stage 目标检测算法和 Two-Stage 目标检测算法。
正文
1. 相关介绍
1.1 背景介绍
从 2006 年以来,在 Hilton、Bengio、LeChun 等人的引领下,大量深度神经网络的
论文被发表,尤其是 2012 年,Hinton 课题组首次参加 ImageNet 图像识别比赛,其通
过构建的 CNN 网络 AlexNet
[1]
一举夺得冠军,从此神经网络开始受到广泛的关注。深度
学习利用多层计算模型来学习抽象的数据表示,能够发现大数据中的复杂结构,目前,这项
技术已成功地应用在包括计算机视觉领域在内的多种模式分类问题上。计算机视觉对于目
标运动的分析可以大致分为三个层次:运动分割,目标检测;目标跟踪;动作识别,行为描述
[2]
。其中,目标检测既是计算机视觉领域要解决的基础任务之一,同时它也是视频监控技术
的基本任务。由于视频中的目标具有不同姿态且经常出现遮挡、其运动具有不规则性,同时
考虑到监控视频的景深、分辨率、天气、光照等条件和场景的多样性,而且目标检测算法的
结果将直接影响后续的跟踪、动作识别和行为描述的效果。故即使在技术发展的今天,目标
检测这一基本任务仍然是非常具有挑战性的课题,存在很大的提升潜力和空间。
1.2 什么是目标检测
图 1: 任务对比图
目标检测即找出图像中所有感兴趣的物体,包含物体定位和物体分类两个子任务,同时
确定物体的类别和位置。
1.3 传统算法概述
传统目标检测的方法一般分为三个阶段:首先在给定的图像上选择一些候选的区域,然
后对这些区域提取特征,最后使用训练的分类器进行分类。下面我们对这三个阶段分别进行
介绍。
(1)区域选择:这一步是为了对目标的位置进行定位。由于目标可能出现在图像的任
何位置,而且目标的大小、长宽比例也不确定,所以最初采用滑动窗口的策略对整幅图像进
行遍历,而且需要设置不同的尺度,不同的长宽比。这种穷举的策略虽然包含了目标所有可
能出现的位置,但是缺点也是显而易见的:时间复杂度太高,产生冗余窗口太多,这也严重
影响后续特征提取和分类的速度和性能。
(2)特征提取:由于目标的形态多样性,光照变化多样性,背景多样性等因素使得设
计一个鲁棒的特征并不是那么容易。然而提取特征的好坏直接影响到分类的准确性。其中,
这个阶段常用的特征有 SIFT
[3]
、HOG
[4]
等。
(3)分类:根据第二步提取到的特征对目标进行分类,分类器主要有 SVM,AdaBoost
等。
2. 基于深度学习的目标检测算法
2.1 算法概述
目标检测任务可分为两个关键的子任务:目标分类和目标定位。目标分类任务负责判断
输入图像或图像区域中是否有感兴趣类别的物体出现,输出一系列带分数的标签表明感兴
趣类别的物体出现在输入图像或图像区域中的可能性。目标定位任务负责确定输入图像或
图像区域中感兴趣类别的物体的位置和范围,输出物体的包围盒、或物体中心、或物体的闭
合边界等,通常方形包围盒是最常用的选择。
目前主流的目标检测算法主要是基于深度学习模型,其可以分成两大类:(1)One-
Stage 检测算法,其不需要 Region Proposal 阶段,直接产生物体的类别概率和位置坐标
值,比较典型的算法如 YOLO、SSD 和 CornerNet;(2)Two-Stage 目标检测算法,其将
检测问题划分为两个阶段,首先产生候选区域(region proposals),然后对候选区域进行
分类和位置精修,这类算法的典型代表是基于 region proposal 的 R-CNN 系列算法,如
R-CNN,Fast R-CNN,Faster R-CNN 等。目标检测模型的主要性能指标是检测准确度和
速度,对于准确度,目标检测要考虑物体的定位以及分类准确度。一般情况下,Two-Stage
算法在准确度上有优势,而 One-Stage 算法在速度上有优势。不过,随着研究的发展,两
类算法都在两个方面做改进,均能在准确度以及速度上取得较好的结果。
2.2 One-Stage 目标检测算法
One-Stage 目标检测算法可以在一个 stage 直接产生物体的类别概率和位置坐标值,
相比于 Two-Stage 的目标检测算法不需要 Region Proposal 阶段,整体流程较为简单。如
下图所示,在 Testing 的时候输入图片产生输出,解码生成对应检测框即可;在 Training 的
剩余17页未读,继续阅读
型爷
- 粉丝: 17
- 资源: 337
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0