【免费】NavneetDalal关于HOG行人识别的博士论文资源-CSDN文库

5星 · 超过95%的资源需积分: 0 94 浏览量 2013-04-20 01:48:29 上传评论 2 收藏 19.22MB PDF 举报

资源推荐

资源详情

资源评论

INSTITUT NAT IONAL POLYTECHNIQUE DE GRENOBLE

Num

ero attribu

e par la

biblioth

eque

ESE

pour obtenir le grade de

DOCTEUR DE L’INSTIT UT NATIONAL POLYTECHNIQUE DE GRENOBLE

ecialit

e : Imagerie, Vision et Robotique

dans le carde de l’

Ecole Doctorale

Math´ematiques, Sciences et Technologie de l’Information

esent

ee et soutenue publiquement

par

Navneet DALAL

le 17 Juillet, 2006

Finding People in Images and Videos

JURY

M. James L. CROWLEY Pr

esident

M. Martial HEBERT Rapporteur

M. Luc Van GOOL Rapporteur

M. Shai AVIDAN Examinateur

Mme. Cordelia SCHMID Directeur de th

ese

M. William J. TRIGGS Directeur de th

ese

ese pr

epar

ee dans le laboratoire GRAVIR – IMAG au sein du

Projet LEAR, INRIA Rh

one-Alpes

655 avenue de l’Europe, 38334 Saint Ismier, France.

R´esum´e

Cette th

ese propose une solution pour la d

etection de personnes et de classes d’objet dans des

images et vid

eos. Le but principal est de d

evelopper des repr

esentations robustes et discrim-

inantes de formes visuelles, qui permettent de d

ecider si un objet de la classe appara

ıt dans

une r

egion de l’image. Les d

ecisions sont bas

ees sur des vecteurs de descripteurs visuels de di-

mension

elev

ee extraits des r

egions. Aﬁn d’avoir une comparaison objective des diff

erents en-

sembles de descripteurs, nous apprenons une r

egle de d

ecision pour chaque ensemble avec un

algorithme de type machine

a vecteur de support lin

eaire. Pilot

e enti

erement par les donn

ees,

notre approche se base sur des descripteurs d’apparence et de mouvement de bas niveau sans

utiliser de mod

ele explicite pour l’objet a d

etecter. Dans la plupart des cas nous nous concen-

trons sur la d

etection de personnes – classe difﬁcile, fr

equente et particuli

erement int

eressante

dans applications come l’analyse de ﬁlm et de vid

eo, la d

etection de pi

etons pour la conduite

assist

ee ou la surveillance. Cependant, notre m

ethode ne fait pas d’hypoth

ese forte sur la classe

a reconna

ıtre et elle donne

egalement des r

esultats satisfaisants pour d’autres classes comme les

voitures, les motocyclettes, les vaches et les moutons.

Nous apportons quatre contributions principales au domaine de la reconnaissance visuelle.

D’abord, nous pr

esentons des descripteurs visuels pour la d

etection d’objets dans les images

statiques : les grilles d’histogrammes d’orientations de gradients d’image (en anglais, HOG –

Histogrammes of Oriented Gradients). Les histogrammes sont

evalu

es sur une grille de blocs

spatiaux, avec une forte normalisation locale. Cette structure assure

a la fois une bonne car-

act

erisation de la forme visuelle locale de l’objet et la robustesse aux petites variations de po-

sition, d’orientation spatiale, d’illumination locale et de couleur. Nous montrons que la combi-

naison de gradients peu liss

es, une quantiﬁcation ﬁne de l’orientation et relativement grossi

ere

de l’espace, une normalisation forte de l’intensit

e, et une m

ethode

evolu

ee de r

e-apprentissage

des cas difﬁciles permet de r

eduire le taux de faux positifs par un

a deux ordres de grandeur

par rapport aux m

ethodes pr

edentes.

Deuxi

emement, aﬁn de d

etecter des personnes dans les vid

eos, nous proposons plusieurs

descripteurs de mouvement bas

es sur le ﬂot optique. Ces descripteurs sont incorpor

es dans

l’approche pr

edente. Analogues aux HOG statiques, ils substituent aux gradients d’image

statique les diff

erences spatiales du ﬂot optique dense. L’utilisation de diff

erences minimise

l’inﬂuence du mouvement de la cam

era et du fond sur les d

etections. Nous

evaluons plusieurs

variations de cette approche, qui codent soit les fronti

eres de mouvement (motion boundaries),

soit les mouvements relatifs des paires de r

egions adjacentes. L’incorporation du mouvement

eduit le taux de faux positifs d’un ordre de grandeur par rapport

a l’approche pr

edente.

Abstract

This thesis targets the detection of humans and other object classes in images and videos. Our

focus is on developing robust feature extraction algorithms that encode image regions as high-

dimensional feature vectors that support high accuracy object/non-object decisions. To test our

feature sets we adopt a relatively simple learning framework that uses linear Support Vector

Machines to classify each possible image region as an object or as a non-object. The approach

is data-driven and purely bottom-up using low-level appearance and motion vectors to detect

objects. As a test case we focus on person detection as people are one of the most challenging

object classes with many applications, for example in ﬁlm and video analysis, pedestrian de-

tection for smart cars and video surveillance. Nevertheless we do not make any strong class

speciﬁc assumptions and the resulting object detection framework also gives state-of-the-art

performance for many other classes including cars, motorbikes, cows and sheep.

This thesis makes four main contributions. Firstly, we introduce grids of locally normalised

Histograms of Oriented Gradients (HOG) as descriptors for object detection in static images.

The HOG descriptors are computed over dense and overlapping grids of spatial blocks, with

image gradient orientation features extracted at ﬁxed resolution and gathered into a high-

dimensional feature vector. They are designed to be robust to small changes in image contour

locations and directions, and signiﬁcant changes in image illumination and colour, while re-

maining highly discriminative for overall visual form. We show that unsmoothed gradients,

ﬁne orientation voting, moderately coarse spatial binning, strong normalisation and overlap-

ping blocks are all needed for good performance. Secondly, to detect moving humans in videos,

we propose descriptors based on oriented histograms of differential optical ﬂow. These are sim-

ilar to static HOG descriptors, but instead of image gradients, they are based on local differ-

entials of dense optical ﬂow. They encode the noisy optical ﬂow estimates into robust feature

vectors in a manner that is robust to the overall camera motion. Several variants are proposed,

some capturing motion boundaries while others encode the relative motions of adjacent image

regions. Thirdly, we propose a general method based on kernel density estimation for fusing

multiple overlapping detections, that takes into account the number of detections, their conﬁ-

dence scores and the scales of the detections. Lastly, we present work in progress on a parts

based approach to person detection that ﬁrst detects local body parts like heads, torso, and legs

and then fuses them to create a global overall person detector.

剩余148页未读，继续阅读

评论收藏

内容反馈

xia316104

2016-12-29

蛮好的，赞
tangyu8188417

2014-10-16

正是我所需要的，资源不假，多谢了！
lichun15

2014-02-21

HOG在行人识别领域是一个很经典的算法，效果很好，多谢楼主上传。
chriswo0724

2015-08-12

做毕设时用到了hog特征，下载后正是我要看的东西，很棒！

tycoonass

粉丝: 0
资源: 1

NavneetDalal关于HOG行人识别的博士论文

HOG博士论文

Dalal的经典论文HOG

Finding People in Images and Videos Navneet Dalal

HOG+SVM行人检测算法

打包Matlab博士论文关于垃圾邮件分类-基于信息熵和决策分类技术的邮件识别研究.pdf

打包Matlab博士论文关于垃圾邮件分类-改进的贝叶斯分类对垃圾邮件识别探讨.pdf

OPENCV HOG特征-SVM分类器行人识别（从训练到识别）.zip

hog-feature.rar_HOG描述子_HOG特征 SVM_feature.hog_物体检测_行人 识别

21组基于SVM+HOG的行人识别.pptx

SVG+HOG行人识别算法的matlab实现

SVM+HOG行人识别算法的matlab实现

HOG 行人检测代码

Hog+SVM行人识别（难例挖掘）

OPENCV HOG特征+SVM分类器行人识别（从训练到识别）

基于树莓派的智能小车，用摄像头实现识别道路中的车道线识别、行人检测与车辆检测，都是基于传统的方法，关键字：级联分类器、HOG+S

关于车辆识别算法和行人识别算法 特征提取.doc

2018年CVPR关于行人重识别的论文

HoG行人检测源码

HOG行人检测要点详解

Hog行人检测

HOG+SVM手势识别可运行程序，识别车

hog行人检测源程序

hogsvm行人数据集

HOG行人快速检测

OpenCV2.4.4实现HOG行人检测

改进hog行人检测源码

Matlab版HOG代码.zip_HOG 人脸识别_HOG人脸识别_snowgx7_人脸HOG特征_人脸识别hog

基于hog特征的行人检测算法

最新资源

hog-feature.rar_HOG描述子_HOG特征 SVM_feature.hog_物体检测_行人识别

关于车辆识别算法和行人识别算法特征提取.doc