人工智能-目标检测-基于部件模型的多类目标检测算法研究.pdf资源-CSDN文库

版权申诉

169 浏览量 2022-06-25 22:51:17 上传评论收藏 2.06MB PDF 举报

资源推荐

资源详情

资源评论

摘要

目标检测作为计算机视觉领域的研究热点，应用十分广泛，其在图像检索、智能交

通等多个领域扮演着重要的角色。在静态图像中目标检测的困难主要是由于各类对象的

外观变化非常大，这些变化不仅包括光照和视角的变化而且还包括物体非刚性变形和类

间形状及其它视觉特性差异。

虽然有很多方法可以实现目标检测，但是由于检测环境的复杂性以及目标的多变性，

目标检测仍然存在很多困难。近年来可变形部件模型在很多领域有重要应用，它能够充

分利用目标的信息来提高检测性能，即使是复杂的环境下或复杂的待检测目标，该模型

都能表现出良好的性能。虽然可变形部件模型较以前的模型有较高的检测精度，但是基

于可变形部件模型的目标检测算法的计算复杂度比较高，仍然存在以下两个问题：第一，

传统的目标检测是基于滑动窗口搜索的方法，利用分类器对图像中不同位置、尺度的区

域进行判断，从而确定该位置是否存在目标。这种方法需要对大量候选窗(区域)做判断，

目标的检索空间大，因此需要较大的计算量；第二，在多类目标检测时，多个类别的模

型对检测位置处的分数计算过程是非常耗时的，尤其是使用非常复杂的分类模型时。例

如使用可变形部件模型进行检测时，需要有大量的滤波器与图像特征金字塔进行卷积，

计算代价高。针对以上问题，本文提出了基于分级判断的方法和稀疏部件模型公共字典

的方法，具体工作内容如下：

(1)针对传统的基于滑动窗口的目标检测方法中目标的检索空间太大的问题，本文提

出了一种基于分级判断的方法，逐级减少需要判断的候选区域，可以大量减少复杂特征

的计算量和分类器需要判断的候选窗数量，进而减少整个检测算法的计算量。在 INRIA

数据集上，实验结果表明基于分级判断的方法可以降低目标检测的误检数目，提高检测

的整体性能。

(2)针对多类目标检测时，需要有大量的滤波器和图像特征金字塔进行卷积运算造成

卷积的计算代价比较高的问题，本文提出了将部件模型进行稀疏化表示，训练一个公共

字典和稀疏激活向量，加快多类目标的检测。在 PASCAL VOC 2007 数据集上，实验结

果表明稀疏部件模型公共字典的方法可以缩短多类目标检测的时间。

关键词：分级判断检测候选区域梯度方向直方图可变形部件模型稀疏部件模型

万方数据

Abstract

Object detection, as a hot research topic in the field of computer vision, is widely used. It

plays an important role in many fields, such as image retrieval, intelligent transportation and

so on. The difficulty of detecting objects in static images is that the appearance of objects

changes a lot. These changes not only come from the light and view condition, but also from

the non-rigid deformation and the shape and other visual characteristics of the objects.

Although there are many ways to achieve the object detection, because of the complexity

of the detection environment and the variability of the objects, there are still many difficulties

in object detection. In recent years, the application of deformable part model is more and

more widely. It can make full use of the information of objects to improve the detection

performance, even in complex environment or complex object to be detected. Although the

deformable parts model has higher detection accuracy than the previous models, the

complexity of object detection based on deformable part model is high and still have two

problems: firstly, the traditional object detection is based on the sliding window search

method, using the classifier to determine the location of the image in different locations, and

then determine whether there is an object. This method requires a large number of candidate

windows (regions) to make judgments, the search space of object is large, so it needs a large

amount of computation. Secondly, in the multi-class object detection, the evaluation process

for each search location is also very time consuming, especially when the classification model

is very complex. For example, when using deformable part models for detecting, you need to

have a lot of filters and image feature pyramid convolution, computation lost is too high. In

view of the above problems, this paper proposes a method based on hierarchical judgment and

a method of sparse part public dictionary, the specific work is as follows:

(1) aiming at the problem of searching space is too large in traditional method which is

based on sliding windows, this paper proposes a method which based on hierarchical

judgment to reduce the candidate regions that need to be determined step by step, so it can

reduce the computational of complexity feature and the number of candidate windows, then

reduce the amount of calculation of the whole algorithm. On the INRIA dataset, the

experimental results show that the method can reduce the number of false detection of object

detection and improve the overall performance of the detection.

(2) aiming at the problem of the convolution computation cost is too high in multi-class

object detection , because of having a large number of filters and image features pyramid

convolution. In this paper, we propose a sparse representation of the part models, train a

common dictionary and sparse activation vectors to speed up the detection of multi-class

objects. On the PASCAL VOC 2007 dataset, the experimental results show that the method

can shorten the time of detection.

Key words：Hierarchical judgment, Detection proposals, Histograms of Oriented Gradients,

Deformable Parts Model, Sparse Part Model

万方数据

- i -

第一章绪论…………………………………………………………………………………...1

1.1 研究背景及意义 .................................................................................................. 1

1.2 国内外研究现状 .................................................................................................. 1

1.2.1 国外研究现状 ............................................................................................ 2

1.2.2 国内研究现状 ............................................................................................ 2

1.3 目标检测的难点 .................................................................................................. 3

1.4 本文的研究内容和结构安排 .............................................................................. 3

第二章目标检测相关基础……………………….……………………...…………………..5

2.1 目标检测框架 ...................................................................................................... 5

2.2 目标检测数据集 .................................................................................................. 6

2.3 特征的提取 ........................................................................................................... 7

2.3.1 局部二值模式特征 ................................................................................... 8

2.3.2 梯度方向直方图特征 ............................................................................... 8

2.3.3 SIFT 特征 .................................................................................................. 8

2.4 SVM 分类器 ......................................................................................................... 9

2.5 评价检测结果 .................................................................................................... 11

2.6 本章小结 ............................................................................................................ 12

第三章基于分级特征和部件模型的目标检测……………………………………………13

3.1 整体框架 ............................................................................................................ 13

3.2 基于 BING 产生目标候选区域......................................................................... 14

3.2.1 获得候选区域的方法 ............................................................................. 14

3.2.2 NG 特征的提取 ....................................................................................... 14

3.2.3 模型的训练 ............................................................................................. 14

3.2.4 获得目标候选区域 ................................................................................. 15

3.3 基于简化 HOG 和 SVM 过滤目标候选区域 ................................................... 16

3.4 结合 DPM 对候选区域进行检测 ...................................................................... 16

3.4.1 可变形部件模型的特征 ......................................................................... 17

3.4.2 可变形部件模型的检测模型 ................................................................. 17

3.4.3 可变形部件模型的检测流程 ................................................................. 18

万方数据

- ii -

3.5 实验结果与分析 ................................................................................................. 19

3.6 本章小结 ............................................................................................................ 23

第四章基于稀疏部件模型的多类目标检测………………………………………………24

4.1 稀疏部件模型 .................................................................................................... 25

4.1.1 激活向量的学习 ..................................................................................... 25

4.1.2 DPM 模型稀疏化的实现过程 ................................................................ 27

4.2 检测过程 ............................................................................................................ 28

4.3 计算代价分析 .................................................................................................... 29

4.4 实验结果分析 .................................................................................................... 30

4.5 本章小结 ............................................................................................................ 32

第五章总结与展望………………………………………………………………………….34

5.1 总结 .................................................................................................................... 34

5.2 展望 .................................................................................................................... 34

参考文献……………………………………………………………………………………...36

发表论文和科研情况说明......................................................................................................39

致谢……………………………………………………………………………………… …………….41

万方数据

第一章绪论

- 1 -

第一章绪论

1.1 研究背景及意义

计算机视觉的任务就是用计算机代替人完成处理和解释，使计算机像人那样能够自

主观察和理解环境

[1]

，而目标检测是计算机视觉中非常重要的一个工作，其研究主要包

括基于视频图像的目标检测和基于静态图像的目标检测。

本文的研究工作主要是在静态图像数据集上进行的，在静态图像中目标检测的任务

就是将与模型匹配的目标检测并定位出来，目标检测是计算机视觉领域的研究热点。检

测目标的困难主要是由各类对象的外观变化大造成的，这些变化不仅包括光照和视角的

变化而且还包括物体的非刚性变形和其它的视觉特性差异

[2]

。目标检测的应用领域十分

广泛，其在图像检索、智能交通等多个领域扮演着重要的角色。

(1)图像检索

以前的图像检索主要是基于文本元数据的方法来对图像进行分类，比如在搜索“车”

这个词时，图像检索引擎只能找出那些在图片的说明字段包括“车”字样的图片。因为

图片的元数据大多是不准确的或者缺失的，因此会漏检掉大量包括车的图片，所以利用

图像信息，直接在图像中进行检测，并根据检测结果对图像分类，这种方法可以精确地

判断出汽车的种类(如大客车、公共汽车等)。

(2)智能交通

社会的飞速发展导致汽车的使用越来越多，随着汽车数量的增多，交通安全也成为

人们关注的重点，如何确保行车安全是现在的研究热点。研究出一套辅助驾驶系统，让

汽车在行驶的过程中检测其周围的行人和车辆，确保在危险发生前及时通知驾驶员，以

此来减少交通事故的发生率。

总之，目标检测具有广泛的应用前景。目前对单一类别的检测研究比较多，但对于

实际场景中，场景是复杂的，在一幅实际场景的图片中，会存在多个类别的目标，所以

本文的研究目的是设计并实现基于可变形部件模型算法

[3-6]

来对场景进行理解，即对待

检测图片进行检测和定位，确定待检测的图像中存在的目标类别，实现对图像的理解。

1.2 国内外研究现状

目前，国内外研究学者对目标检测进行了大量的研究。现在主要使用基于统计学习

的方法，该方法的发展过程主要经历了三个阶段：第一个阶段是 Viola 等人在 2003 年构

造的基于滑动窗口搜索策略的目标检测算法

[7]

；第二个阶段是 Dalal 和 Triggs 在 2005 年

提出的 HOG 特征

[8]

；第三个阶段是 Felzenswalb 在 2008 年提出的可变形部件模型，对

目标的形变有很强的鲁棒性。

万方数据

剩余40页未读，继续阅读

评论收藏

内容反馈

版权申诉

programhh

粉丝: 8
资源: 3838

人工智能-目标检测-基于部件模型的多类目标检测算法研究.pdf

论文研究-基于可变形部件模型的台标识别方法.pdf

基于SOC的高速密码算法部件研究与应用.pdf-综合文档

论文研究-基于可变形部件模型的安全头盔佩戴检测.pdf

基于可变部件模型的车牌检测识别在线学习算法

论文研究-车辆检测中可变形部件模型的改进与应用.pdf

人工智能-目标检测-基于词包模型的高分辨率SAR图像舰船目标检测.pdf

人工智能-目标检测-基于多特征融合的目标检测与跟踪算法研究.pdf

人工智能-目标检测-基于CCD成像跟踪的卫星目标检测算法研究.pdf

人工智能-无人机图像目标检测.zip 人工智能-无人机图像目标检测

论文研究-基于球结构的完全二叉树SVM多类分类算法.pdf

论文研究-基于核空间相对密度的SVDD多类分类算法.pdf

论文研究-基于空间重叠度的DTBSVM多类分类算法.pdf

论文研究-基于MFCC和SVM的多类分类算法在孤立词语音识别系统的研究 .pdf

人工智能-目标检测-基于视频图像序列的目标检测及跟踪算法研究.pdf

人工智能-目标检测-基于光学相关识别的高光谱图像目标检测算法研究.pdf

人工智能-目标检测-基于Kinect深度图像的人体目标检测与跟踪算法研究.pdf

人工智能-目标检测-基于背景减法和帧差法的运动目标检测算法研究.pdf

人工智能-目标检测-基于时域廓线向量积的红外弱小目标检测算法研究.pdf

人工智能-目标检测-基于UWB信号的隐藏活动目标检测装置和定位算法研究.pdf

人工智能-目标检测-运动目标检测和跟踪算法研究.pdf

人工智能-目标检测-基于改进Mean Shift算法的运动目标检测与跟踪研究.pdf

人工智能-目标检测-基于MPEG-4的运动目标检测技术研究.pdf

人工智能-目标检测-基于深度学习的鱼眼图像目标检测研究.pdf

人工智能-目标检测-基于深度学习的快速目标检测技术研究.pdf

人工智能-目标检测-智能视觉监控系统运动目标检测算法研究.pdf

人工智能-目标检测-基于图像序列的多目标检测与跟踪.pdf

人工智能-目标检测-基于视频的运动目标检测与跟踪研究.pdf

人工智能-目标检测-基于数值形态滤波的红外目标检测技术研究.pdf

最新资源