第 26 卷 第 11 期
Vol. 26 No. 11
控 制 与 决 策
Control and Decision
2011 年 11 月
Nov. 2011
基于多尺度上下文信息的图像目标分类算法
文章编号: 1001-0920 (2011) 11-1643-06
杨 蕾, 宋永红, 郑南宁
(西安交通大学 人工智能与机器人研究所,西安 710049)
摘 要: 针对真实场景图像的目标分类问题, 提出一种基于多尺度上下文信息的分类算法. 首先运用一种软判决采
样机制对图像进行局部信息采样, 使场景内混合的各类信息以一种鲁棒的方式得到有效分离; 然后, 进一步基于软判
决采样和统计特征表达机制, 计算各空间尺度下的目标上下文统计特征; 最后, 通过逻辑回归分类算法有效地融合多
尺度的上下文信息, 并作出分类决策. 实验表明, 所提出的算法能更好地刻画真实场景下目标的特性, 明显提高图像
目标分类性能.
关键词: 图像目标分类;多尺度上下文信息;软判决采样机制;外观统计特征
中图分类号: TP391 文献标识码: A
Object categorization using context from multi-spatial levels
YANG Lei, SONG Yong-hong, ZHENG Nan-ning
(Institute of Artificial Intelligence and Robotics,Xi’an Jiaotong University,Xi’an 710049,China.Correspondent:
YANG Lei,E-mail:lyang@aiar.xjtu.edu.cn)
Abstract:::To categorize objects in the real-world scene images, a method is proposed by exploiting multi-spatial extent
context. Firstly, a soft decision-based sampling mechanism is utilized in the local image patch sampling process, by which,
mixed information in the scene can be separated in an effective and robust way. Then, by using the soft decision-based
sampling mechanism and the statistical representation methods, the statistical feature for each spatial extent context can
be computed. Finally, a logistic regression classification method is adopted to integrate multiple spatial extent context
information and make the final decisions. The experiments show that, the proposed method can better model the objects in
the real world scenes, and thus apparently improves the object categorization performance.
Key words:::object categorization;multiple extent context;soft decision-based sampling mechanism;statistical
appearance representation
1 引引引 言言言
目标分类技术是自动分析、理解图像与场景的
关键技术之一, 旨在判断图像媒体中是否存在属于某
类物体的实体, 可应用于图像自动标注、海量图像搜
索、自动图片过滤、图像编码及压缩、智能监控等领
域. 真实场景下, 如何体现形态各异的同类个体之间
的共性, 同时突出类间差异, 如何建立具有一般推广
性的统一的分类模型以及如何消除复杂背景对感兴
趣目标的干扰等, 都是目标分类技术当前所面临的主
要挑战
[1]
.
目前, 非常流行的基于外观统计特征的 BoF (Bag
-of-Features) 分类模型对目标类内差异、变形及遮挡
表现出了良好的鲁棒性
[1-4]
, 但传统的 BoF 方法实质
上刻画的是图像内的整体场景信息, 并将该统计特
征用于目标分类任务. 对于真实场景, 特别是复杂场
景下的目标, 比如场景内出现的较小的目标, 传统
BoF 方法不能明确地刻画感兴趣目标的特性, 因而容
易造成误判. 如何更有效地针对真实场景内的感兴
趣目标进行建模, 同时保证算法具有较好的适应遮
挡、变形以及类内差异的鲁棒性是本文研究的重点.
本文在 BoF 模型框架下, 提出了一种新的基于多
尺度上下文信息的目标分类算法. 利用一种自顶向下
的软判决机制指导局部信息采样过程, 以一种鲁棒的
方式有效地提取并刻画目标自身外观上下文信息、各
尺度局部上下文信息以及全局场景信息, 同时避免在
目标分类过程中实现困难的目标定位或语义性分割.
收稿日期: 2010-07-02;修回日期: 2010-08-31.
基金项目: 国家973计划项目(2007CB311005);国家自然科学基金重大科学研究计划项目(90920008).
作者简介: 杨蕾(1983−), 女, 博士生, 从事目标分类与识别、机器视觉的研究;郑南宁(1952−), 男, 中国工程院院士, 教
授, 博士生导师, 从事自动控制、模式识别及计算机视觉等研究.