0 引言
近年来,随着人工智能浪潮的到来,计算机视觉技术如目标检测、图像识别极大改善了人类的生活
方式.行人检测是通过计算机技术判断图片或者视频序列中是否包含行人目标并且定位,通过结合其它计
算机技术,可以广泛地应用在智能安防.自动驾驶以及人流量监控等场合.在行人检测领域,计算机与人之
间仍然存在显著的差距
[1]
.
目前,行人检测算法的研究主要集中在以下两个部分.第一部分是特征提取阶段.文[2]通过对原始图
像进行相似变换提取了 10 个通道的聚合通道特征,包括 1 个梯度幅值通道、3 个颜色通道及 6 个梯度方
向通道.文[3]利用平均人形模板进行手工设计滤波器来生成 Haar 小波特征.文[4]改进了传统的局部二进制
模式(LBP)方法,即邻域差分统计特征.文[5]提出了结合人形先验信息的随机投影特征,获得了更好的检测
结果.第二部分是分类器训练阶段.传统机器学习中比较经典的分类器算法主要包括支持向量机(SVM)和集
成学习(Boosting)方法
[6]
.文[7]提出了一种带有级联结构与核函数的支持向量机算法.还有一些学者提出附加
通道特征的方法,比如利用光流信息,即将相邻帧的信息融入到 10 个变换通道中.文[8]在行人检测中引入
了语义分割.实验结果表明,特征提取量越大,检测器的性能越好.以光流算法为例,向特征通道附加新的
特征可以提高检测器的性能,但是缺乏标准的特征提取方法.
由于传统机器学习算法中需要人为设计滤波器,包含一定人为误差,大量基于深度学习的目标检测
算法应运而出.通过使用深层神经网络,如卷积神经网络(CNN),随着层数的增加,可以提取更高层次的特
征.文[9]将传统行人检测方法中的特征提取和分类阶段集成到深度学习模型中大幅提高了检测性能.融合机
器学习与深度学习两种方法也是可行的,文[10]综合利用两种检测器获得了更高的检测精度.
然而检测精度与检测速度之间往往不能兼得,深度学习算法无法满足实时检测的速度要求,本文重
点研究传统机器学习算法,即高层次特征提取的通道特征图方法.由于传统的 10 个通道特征是对原始图像
进行相似变换得到的,包含了大量的带有耦合的冗余信息.因此,局部去相关通道特征
[2]
(LDCF)通过主成
分分析法进行去相关操作来获得更具鉴别力的特征通道图.传统的去相关方法是对正样本全部区域提取协
方差进行去相关操作,忽略了具有高辨识度的区域,导致新的通道特征之间仍然存在一定的耦合信息.在
分类阶段,根据决策树节点权重值生成的权重图,提出一种基于平均人体形状不变性的区域选择方法.提
出方法的关键点在于找到通道特征图中具有更高行人辨识度的区域,即在分类阶段中该区域特征具有更高
的权重,从这些特定区域提取协方差矩阵而不是从正样本全部区域提取协方差,可以更好地去除通道特征
间的耦合信息,进而获得更好的检测效果以及更快的检测速度.
1 去相关聚合通道特征
传统行人检测算法包括特征提取和分类器训练两个阶段.常用的提取特征方法包括 Haar 小波特征、
局部二进制特征(LBP)、梯度方向直方图特征(HOG)、颜色空间特征(LUV)、边缘信息等.然而只提取单一
特征并不能获得理想的检测效果,将多种通道特征进行融合,如积分通道特征(ICF)
[11]
、聚合通道特征
(ACF)
[12]
等可以获得更好的检测效果. ICF 是通过计算积分图的形式快速计算原始图像的特征通道,在行
人检测中使用了 10 个积分特征通道,包括 3 个颜色空间通道特征(LUV),1 个梯度幅值通道(G)以及 6 个
梯度方向通道特征(ORIG).文[12]提出的 ACF 特征是对 ICF 特征的一种改进,其使用的特征通道与 ICF 相
同.但 ACF 通过对特征通道采取像素块随机查找的方法提取特征,而 ICF 采用对矩形区域的像素求和的形
评论0
最新资源