基于多特征融合的行人检测方法.docx资源-CSDN文库

版权申诉

文档资料

143 浏览量 2022-07-14 11:06:31 上传评论收藏 745KB DOCX 举报

资源推荐

资源详情

资源评论

行人检测作为一个典型的目标检测问题,是近年来研究的热点。行人检测

被广泛应用于智能交通、自动驾驶、视频监控、行为分析等领域。行人检测的

目的是利用计算机视觉技术判断图像或视频序列中是否存在行人并给予精确

定位。目前,大部分行人检测方法将行人检测问题作为一个二分类问题,即判断

目标图像中的所有候选窗口是否为行人,然后进行非极大值抑制。

目前行人检测方法大致可以分为两大类:传统的机器学习方法和深度学习

方法。传统的机器学习特征是手工设计的特征,包括提取特征和使用分类器进

行分类两个步骤。但是在行人检测任务中,与分类器的选择相比,特征的选择更

为重要。为了克服行人身体的形变性以及行人的外观容易受到姿势、穿着、光

照变化和背景影响等问题,研究人员分别使用图像的轮廓、纹理和颜色特征完

成行人检测任务。因此,Haar-like

[1]

、方向梯度直方图(Histogram of Oriented

Gradient,HOG)

[2]

、Shapelet

[3]

、本地二进制模式(Local Binary Pattern,LBP)

[4]

、

颜色自相似性特征 (Color Self Similarities,CSS)

[5]

与积分通道特征 (Integral

Channel Feature,ICF)

[6]

等特征成为了行人检测任务中较为常见的机器学习特

征。由于上述特征在行人检测中具有良好表现,研究者在原有特征的基础上提

出了 FHOG(Felzenszwalb HOG)

[7]

、本地三单元模式 (Local Ternary

Pattern,LTP)

[8]

、有效局部二进制模式 (Significant Local Binary

Pattern,SLBP)

[9]

、聚合通道特征 (Aggregate Channel Feature,ACF)

[10]

、局部

去相关通道特征(Locally Decorrelated Channel Feature,LDCF)

[11]

以及过滤通

道特征(Filtered Channel Features,FCF)

[12]

等特征。

近年来,深度学习尤其是卷积神经网络在人脸识别、图像分类、行人检测

等领域表现出较强的优势受到研究者的广泛关注

[13,14,15,16]

。早期卷积神经网络

的结构比较简单,例如经典的 LeNet-5 模型

[17]

,主要用于手写体识别和图像分类。

手写体识别和图像分类是相对单一的计算机视觉应用。随着研究的不断深入,

特别是在 2012 年 ILSVRC 比赛中 AlexNet 模型

[18]

以远远超过第二名的识别率

获得冠军后,卷积神经网络的应用领域逐渐扩大。卷积神经网络作为一种深度

学习方法,通过建立深度神经网络而不是人工设计特征来模拟人脑的学习过程。

该方法改变了传统的机器学习且能够独立提取特征,达到了减少人工干预的目

的。卷积神经网络接受灰度图像或彩色图像作为神经网络的输入,具有连续的

卷积层和可训练的权重。每个卷积层可以建立多个特征图,通过不同的卷积核

可得到不同特征的不同描述。

本文在传统的卷积神经网络模型 VGG19 模型的基础上,提出了一种结合

传统机器学习特征和深度学习特征的行人检测模型—多通道特征模型。多通道

特征模型由 3 个分支组成:非深度学习分支、整体分支和肢体分支。其中整体

分支以及肢体分支是通过多层卷积通道特征得到的。为了通过有效的搜索方法

来减轻使用卷积神经网络滑动窗口穷举搜索带来的计算负担,并提高计算效率,

本文使用了非深度学习分支。本文在多层卷积通道特征之前级联了目前最先进

的非深度学习行人检测器之一的 LDCF 行人检测器。多层卷积通道特征将传统

的通道特征方法从基于 HOG+LUV 的特征扩展到卷积特征映射,以有限的计算

量增长为代价获得性能提升。同时,由于不同层的特性不同,这些层可以提供更

丰富的特征提取。并且在多层卷积通道特征中利用两个分支分别通过人体整体

信息和人体部位的语义信息来检测行人。在肢体分支中,肢体的语义信息可以

通过长短时记忆网络(Long Short-Term Memory,LSTM)

[23]

相互通信。结合各分

支的输出,本文开发了一种强互补的行人检测器。该检测器具有较低的漏检率

和较高的定位精度,尤其适用于行人形变以及遮挡行人等情况下的检测。

1 相关研究

近年来在行人检测方法的研究中 ,在传统的机器学习特征方面 HOG

[2]

、

LBP

[3]

等特征起着非常重要的作用,尤其是方向梯度直方图特征(HOG)

[2]

。HOG

法利用图像的局部方差来检测行人,并使用线性支持向量机分类器达到了很好

的分类效果。研究人员在 HOG 的基础上通过级联 AdaBoost 分类器,提出了

ICF

[6]

。积分通道特征的具体过程如下:首从原始的 RGB 图像中提取 6 个方向的

HOG 特征通道和 LUV 颜色通道;然后利用 6 个方向的 HOG 特征通道和 LUV

颜色通道训练 AdaBoost 分类器。为了进一步加快检测速度,研究人员提出了

ACF

[10]

,该方法可将图像通道的采样率降低 4 倍。由于通道特征在行人检测的

优秀表现,研究者们在 ICF

[6]

之后,还提出了 LDCF

[11]

、FCF

[12]

。LDCF

[11]

在 ACF

[10]

的基础上提出,其通过将 pca-like 滤波器与 HOG+LUV 图像通道进行卷积计算

去相关通道特征。FCF

[12]

在 HOG+LUV 图像通道的基础上卷积过滤器 (例如随

机过滤器、棋盘格过滤器等)来生成候选特征池。结果表明,使用简单的棋盘格

过滤器就可以获得很好的性能。ICF

[6]

、ACF

[10]

、LDCF

[11]

以及 FCF

[12]

都使用相

同的图像通道(即 HOG+LUV)作为图像通道。

基于深度卷积神经网络(Convolutional Neural Network,CNN)的方法在行

人检测方面

[13,14,15,16]

也取得了很大的成功。CNN 模型的两个特性在它的成功中

发挥了关键作用:(1)特征表示是通过分层方式习得的,其代表能力随卷积层深度

的增加而增强;(2)CNN 特征具有良好的泛化能力。具体地说,深度 CNN 特征可

以在不进行微调的情况下转移到一般的识别任务中。一般来说,使用卷积神经

网络进行检测首先需要生成候选对象窗口,然后使用训练好的 CNN 模型对这些

窗口进行分类。文献[19]使用基于手工特征的方法提取候选行人建议窗口,然后

将广义 CNN 模型例如 AlexNet 以及 ImageNet 等用于行人检测。使用手工特

征例如边缘特征

[20]

提取候选行人建议窗口在计算效率方面是十分有效的。文献

[15]使用最先进的非深度学习分类器提取候选行人建议窗口,减少了候选行人

建议窗口,在减小计算量的同时提高了检测精度。文献[21]通过引入与检测网络

共享全图像卷积特性的区域建议网络(Region Proposal Network,RPN),提出了

Faster R-CNN。RPN 是一个全卷积网络,其经过端到端训练能够快速生成高质

量的区域建议窗口,并能够同时预测每个位置的对象边界和对象得分。尽管基

于 CNN 的行人检测取得了成功,但仍有一定的改进空间:首先,通过利用行人建

议窗口的得分信息来提高检测性能;其次,CNN 的每一层都包含一些判别特征。

本文在通道特征的基础上将手工制作的通道特征替换为不同层的卷积通道特

征。目前已经有一些作品尝试将 CNN 与流行的通道特征联系起来,例如卷积通

道特征(Convolutional Channel Features,CCF)

[21]

。CCF 将预训练的 CNN 模型

作为低层特征提取器,并且使用决策树作为分类器。卷积通道特征结合了 CNN

的特征,传统的通道特征相比,CCF 具有更丰富的特征表示能力。然而卷积通道

特征仅仅使用了一层低层卷积特征,忽略了 CNN 的每一层都包含一些判别特征

尤其是 CNN 的深层卷积特征。此外,卷积通道特征并没有使用通道特征快速的

拒绝非行人检测窗口,这样会增加卷积通道特征方法的计算量。

2 多通道特征模型

本文在多特征融合的基础上提出了一个多通道特征模型。多通道特征模型

由非深度学习分支、整体分支以及肢体分支组成。为了通过有效的搜索方法减

轻滑动窗口穷举搜索带来的计算负担,提高计算效率,该模型使用了非深度学习

分支。该模型所使用的非深度学习分支是 LDCF 行人检测器。与仅仅使用 LDCF

行人检测器完成行人检测任务不同的是,本文在整体分支以及肢体分支之前级

剩余11页未读，继续阅读

评论收藏

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3655
资源: 1万+

基于多特征融合的行人检测方法.docx

多特征融合的行人检测算法

基于多特征融合的行人检测方法研究

基于特征融合的行人重识别算法

结合语义和多层特征融合的行人检测.docx

基于深度学习的行人检测.docx

一种基于改进型YOLOv3卷积神经网络的夜间车辆检测方法.docx

基于高斯建模和YoLo V3目标检测的遗留物检测方法.docx

一种基于YOLO v3神经网络的工业零件检测方法.docx

基于深度学习的厨师帽和口罩佩戴的检测方法.docx

基于特征融合的多尺度行人检测方法.pdf

多特征融合的行人检测算法 (2013年)

基于多视觉特征融合的行人检测

基于多特征的AdaBoost行人检测算法

融合属性特征的行人重识别方法.docx

一种基于YOLOv3优化算法的交通灯检测方法.docx

基于多特征融合的Webshell恶意流量检测方法.docx

基于YOLOv3的监控场景下的安防敏感物品检测方法.docx

基于卷积神经网络的行人检测方法.docx

基于优化PSO-BP的多特征融合图像识别算法研究.docx

基于特征融合网络的行人重识别

基于IKSVM的多特征行人检测算法

基于感兴趣区域特征融合的行人检测方法研究

多层卷积特征融合的行人检测

基于辨识特征后融合的行人再识别

基于YOLOv3多伯努利视频多目标检测跟踪方法.docx

结合头部和整体信息的多特征融合行人检测.docx

基于注意力机制的多特征融合人脸活体检测.docx

基于多模态特征融合的Fast-Flux恶意域名检测方法.docx

基于形态非抽样小波的实时图像融合方法.docx

最新资源