如果把今天的物体检测看作是深度学习力量下的一种技术美
学,那么回到几年年前,将见证“冷兵器时代的智慧”。早期的目
标检测算法大多是基于手工特征构建的。由于当时缺乏有效的图像
表示,人们别无选择,只能设计复杂的特征表示,以及各种加速技
术来用尽有限的计算资源。
(1)Viola Jones Detectors
18 年前,P. Viola 和 M. Jones 在没有任何约束条件(如肤色分割)
的情况下首次实现了人脸的实时检测。在 700MHz Pentium III CPU
上,在同等的检测精度下,检测器的速度是其他算法的数十倍甚至
数百倍。这种检测算法,后来被称为“维奥拉-琼斯”(VJ)检测
器”,在此以作者的名字命名,以纪念他们的重大贡献。
VJ 检测器采用最直接的检测方法,即,滑动窗口:查看图像中所有
可能的位置和比例,看看是否有窗口包含人脸。虽然这似乎是一个
非常简单的过程,但它背后的计算远远超出了计算机当时的能力。
VJ 检测器结合了 “ 积分图像 ”、“ 特征选择 ” 和 “ 检
测级联 ” 三种重要技术,大大提高了检测速度。
积分图像:积分图像是一种计算方法,以加快盒滤波或卷积过程。
与当时的其他目标检测算法一样,在 VJ 检测器中使用 Haar 小波作
为图像的特征表示。积分图像使得 VJ 检测器中每个窗口的计算复杂
度与其窗口大小无关。