Hough Forests是一种用于目标检测的技术,尤其适用于那些在自然图像中外观变化很大的对象类,如汽车或行人。本文所提出的检测方法,即Class-Specific Hough Forests for Object Detection,通过推广的霍夫变换实现对特定对象类实例的检测。与以往使用生成式部件外观码本的方法不同,本文的方法采取了更具判别性的目标部件检测方式。这是通过训练一个特定于类别的Hough森林完成的,即一种能够直接将图像补丁外观映射到关于对象质心可能位置的概率投票的随机森林。作者展示了Hough Forests显著提高了霍夫变换目标检测的结果,并为多个类别和数据集达到了最先进的性能。
文章开头提到了目标检测中的一个核心问题,即相同类别对象在自然图像中的外观由于类内差异、照明变化、成像条件以及对象的可动性,会有很大差异。为了简化检测(定位),大多数方法采取了基于部件、自底向上的方法,即通过整合单个目标部件(特征)的检测来推理整个对象的位置。本文所提到的基于霍夫变换的方法,比如Leibe等人所提出的方法,通过学习特定类的隐式形状模型(ISM),本质上是特定类别的兴趣点描述符的码本。创建码本后,每个条目都会被赋予一组相对于对象质心的偏移量,这些偏移量是基于训练数据观察到的。在运行时,图像中的兴趣点描述符会与码本进行匹配,并根据训练数据中观察到的对象质心的偏移量,对可能的对象位置进行概率投票。这些投票被累加到一个Hough图像中,Hough图像中的最大值对应着检测假设。
本文的关键贡献在于提出了一种新的方法来训练特定于类别的Hough森林,这种森林能够直接将图像补丁外观映射到关于对象质心可能位置的概率投票。具体而言,这种方法通过利用随机森林来实现,每棵树都会对图像中感兴趣区域的位置进行投票,从而实现对目标的检测。与传统的霍夫变换方法相比,该方法更为判别性,它能够更好地处理目标部件的外观变化和定位问题。
文章还提到了码本的创建和偏移量的分配过程。在此过程中,码本中的每个条目都有一个针对训练数据中观察到的质心位置的偏移集合。这意味着,通过匹配图像中的兴趣点描述符与码本条目,可以累积出一个概率投票图,其中的峰值反映了对象可能的位置。该过程是霍夫变换在目标检测中应用的一个关键步骤,因为它能够将部件的检测转换为对整个对象位置的推断。
文章最后强调了Hough Forests方法在多个类别和数据集上所达到的先进性能,并指出了未来的研究方向。这些方向包括但不限于提高检测的准确性、降低计算复杂度以及处理更为复杂和多样化的真实世界场景。总体而言,Hough Forests为理解目标检测中的部件基方法提供了一个新的视角,并为未来的相关研究奠定了基础。