没有合适的资源?快使用搜索试试~ 我知道了~
人工智能-目标检测-基于部件模型的多类目标检测算法研究.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 169 浏览量
2022-06-25
22:51:17
上传
评论
收藏 2.06MB PDF 举报
温馨提示
试读
41页
人工智能-目标检测-基于部件模型的多类目标检测算法研究.pdf
资源推荐
资源详情
资源评论
摘要
目标检测作为计算机视觉领域的研究热点,应用十分广泛,其在图像检索、智能交
通等多个领域扮演着重要的角色。在静态图像中目标检测的困难主要是由于各类对象的
外观变化非常大,这些变化不仅包括光照和视角的变化而且还包括物体非刚性变形和类
间形状及其它视觉特性差异。
虽然有很多方法可以实现目标检测,但是由于检测环境的复杂性以及目标的多变性,
目标检测仍然存在很多困难。近年来可变形部件模型在很多领域有重要应用,它能够充
分利用目标的信息来提高检测性能,即使是复杂的环境下或复杂的待检测目标,该模型
都能表现出良好的性能。虽然可变形部件模型较以前的模型有较高的检测精度,但是基
于可变形部件模型的目标检测算法的计算复杂度比较高,仍然存在以下两个问题:第一,
传统的目标检测是基于滑动窗口搜索的方法,利用分类器对图像中不同位置、尺度的区
域进行判断,从而确定该位置是否存在目标。这种方法需要对大量候选窗(区域)做判断,
目标的检索空间大,因此需要较大的计算量;第二,在多类目标检测时,多个类别的模
型对检测位置处的分数计算过程是非常耗时的,尤其是使用非常复杂的分类模型时。例
如使用可变形部件模型进行检测时,需要有大量的滤波器与图像特征金字塔进行卷积,
计算代价高。针对以上问题,本文提出了基于分级判断的方法和稀疏部件模型公共字典
的方法,具体工作内容如下:
(1)针对传统的基于滑动窗口的目标检测方法中目标的检索空间太大的问题,本文提
出了一种基于分级判断的方法,逐级减少需要判断的候选区域,可以大量减少复杂特征
的计算量和分类器需要判断的候选窗数量,进而减少整个检测算法的计算量。在 INRIA
数据集上,实验结果表明基于分级判断的方法可以降低目标检测的误检数目,提高检测
的整体性能。
(2)针对多类目标检测时,需要有大量的滤波器和图像特征金字塔进行卷积运算造成
卷积的计算代价比较高的问题,本文提出了将部件模型进行稀疏化表示,训练一个公共
字典和稀疏激活向量,加快多类目标的检测。在 PASCAL VOC 2007 数据集上,实验结
果表明稀疏部件模型公共字典的方法可以缩短多类目标检测的时间。
关键词:分级判断 检测候选区域 梯度方向直方图 可变形部件模型 稀疏部件模型
万方数据
Abstract
Object detection, as a hot research topic in the field of computer vision, is widely used. It
plays an important role in many fields, such as image retrieval, intelligent transportation and
so on. The difficulty of detecting objects in static images is that the appearance of objects
changes a lot. These changes not only come from the light and view condition, but also from
the non-rigid deformation and the shape and other visual characteristics of the objects.
Although there are many ways to achieve the object detection, because of the complexity
of the detection environment and the variability of the objects, there are still many difficulties
in object detection. In recent years, the application of deformable part model is more and
more widely. It can make full use of the information of objects to improve the detection
performance, even in complex environment or complex object to be detected. Although the
deformable parts model has higher detection accuracy than the previous models, the
complexity of object detection based on deformable part model is high and still have two
problems: firstly, the traditional object detection is based on the sliding window search
method, using the classifier to determine the location of the image in different locations, and
then determine whether there is an object. This method requires a large number of candidate
windows (regions) to make judgments, the search space of object is large, so it needs a large
amount of computation. Secondly, in the multi-class object detection, the evaluation process
for each search location is also very time consuming, especially when the classification model
is very complex. For example, when using deformable part models for detecting, you need to
have a lot of filters and image feature pyramid convolution, computation lost is too high. In
view of the above problems, this paper proposes a method based on hierarchical judgment and
a method of sparse part public dictionary, the specific work is as follows:
(1) aiming at the problem of searching space is too large in traditional method which is
based on sliding windows, this paper proposes a method which based on hierarchical
judgment to reduce the candidate regions that need to be determined step by step, so it can
reduce the computational of complexity feature and the number of candidate windows, then
reduce the amount of calculation of the whole algorithm. On the INRIA dataset, the
experimental results show that the method can reduce the number of false detection of object
detection and improve the overall performance of the detection.
(2) aiming at the problem of the convolution computation cost is too high in multi-class
object detection , because of having a large number of filters and image features pyramid
convolution. In this paper, we propose a sparse representation of the part models, train a
common dictionary and sparse activation vectors to speed up the detection of multi-class
objects. On the PASCAL VOC 2007 dataset, the experimental results show that the method
can shorten the time of detection.
Key words:Hierarchical judgment, Detection proposals, Histograms of Oriented Gradients,
Deformable Parts Model, Sparse Part Model
万方数据
- i -
目 录
第一章 绪论…………………………………………………………………………………...1
1.1 研究背景及意义 .................................................................................................. 1
1.2 国内外研究现状 .................................................................................................. 1
1.2.1 国外研究现状 ............................................................................................ 2
1.2.2 国内研究现状 ............................................................................................ 2
1.3 目标检测的难点 .................................................................................................. 3
1.4 本文的研究内容和结构安排 .............................................................................. 3
第二章 目标检测相关基础……………………….……………………...…………………..5
2.1 目标检测框架 ...................................................................................................... 5
2.2 目标检测数据集 .................................................................................................. 6
2.3 特征的提取 ........................................................................................................... 7
2.3.1 局部二值模式特征 ................................................................................... 8
2.3.2 梯度方向直方图特征 ............................................................................... 8
2.3.3 SIFT 特征 .................................................................................................. 8
2.4 SVM 分类器 ......................................................................................................... 9
2.5 评价检测结果 .................................................................................................... 11
2.6 本章小结 ............................................................................................................ 12
第三章 基于分级特征和部件模型的目标检测……………………………………………13
3.1 整体框架 ............................................................................................................ 13
3.2 基于 BING 产生目标候选区域......................................................................... 14
3.2.1 获得候选区域的方法 ............................................................................. 14
3.2.2 NG 特征的提取 ....................................................................................... 14
3.2.3 模型的训练 ............................................................................................. 14
3.2.4 获得目标候选区域 ................................................................................. 15
3.3 基于简化 HOG 和 SVM 过滤目标候选区域 ................................................... 16
3.4 结合 DPM 对候选区域进行检测 ...................................................................... 16
3.4.1 可变形部件模型的特征 ......................................................................... 17
3.4.2 可变形部件模型的检测模型 ................................................................. 17
3.4.3 可变形部件模型的检测流程 ................................................................. 18
万方数据
- ii -
3.5 实验结果与分析 ................................................................................................. 19
3.6 本章小结 ............................................................................................................ 23
第四章 基于稀疏部件模型的多类目标检测………………………………………………24
4.1 稀疏部件模型 .................................................................................................... 25
4.1.1 激活向量的学习 ..................................................................................... 25
4.1.2 DPM 模型稀疏化的实现过程 ................................................................ 27
4.2 检测过程 ............................................................................................................ 28
4.3 计算代价分析 .................................................................................................... 29
4.4 实验结果分析 .................................................................................................... 30
4.5 本章小结 ............................................................................................................ 32
第五章 总结与展望………………………………………………………………………….34
5.1 总结 .................................................................................................................... 34
5.2 展望 .................................................................................................................... 34
参考文献……………………………………………………………………………………...36
发表论文和科研情况说明......................................................................................................39
致 谢……………………………………………………………………………………… …………….41
万方数据
第一章 绪论
- 1 -
第一章 绪论
1.1 研究背景及意义
计算机视觉的任务就是用计算机代替人完成处理和解释,使计算机像人那样能够自
主观察和理解环境
[1]
,而目标检测是计算机视觉中非常重要的一个工作,其研究主要包
括基于视频图像的目标检测和基于静态图像的目标检测。
本文的研究工作主要是在静态图像数据集上进行的,在静态图像中目标检测的任务
就是将与模型匹配的目标检测并定位出来,目标检测是计算机视觉领域的研究热点。检
测目标的困难主要是由各类对象的外观变化大造成的,这些变化不仅包括光照和视角的
变化而且还包括物体的非刚性变形和其它的视觉特性差异
[2]
。目标检测的应用领域十分
广泛,其在图像检索、智能交通等多个领域扮演着重要的角色。
(1)图像检索
以前的图像检索主要是基于文本元数据的方法来对图像进行分类,比如在搜索“车”
这个词时,图像检索引擎只能找出那些在图片的说明字段包括“车”字样的图片。因为
图片的元数据大多是不准确的或者缺失的,因此会漏检掉大量包括车的图片,所以利用
图像信息,直接在图像中进行检测,并根据检测结果对图像分类,这种方法可以精确地
判断出汽车的种类(如大客车、公共汽车等)。
(2)智能交通
社会的飞速发展导致汽车的使用越来越多,随着汽车数量的增多,交通安全也成为
人们关注的重点,如何确保行车安全是现在的研究热点。研究出一套辅助驾驶系统,让
汽车在行驶的过程中检测其周围的行人和车辆,确保在危险发生前及时通知驾驶员,以
此来减少交通事故的发生率。
总之,目标检测具有广泛的应用前景。目前对单一类别的检测研究比较多,但对于
实际场景中,场景是复杂的,在一幅实际场景的图片中,会存在多个类别的目标,所以
本文的研究目的是设计并实现基于可变形部件模型算法
[3-6]
来对场景进行理解,即对待
检测图片进行检测和定位,确定待检测的图像中存在的目标类别,实现对图像的理解。
1.2 国内外研究现状
目前,国内外研究学者对目标检测进行了大量的研究。现在主要使用基于统计学习
的方法,该方法的发展过程主要经历了三个阶段:第一个阶段是 Viola 等人在 2003 年构
造的基于滑动窗口搜索策略的目标检测算法
[7]
;第二个阶段是 Dalal 和 Triggs 在 2005 年
提出的 HOG 特征
[8]
;第三个阶段是 Felzenswalb 在 2008 年提出的可变形部件模型,对
目标的形变有很强的鲁棒性。
万方数据
剩余40页未读,继续阅读
资源评论
programhh
- 粉丝: 8
- 资源: 3838
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功