计算机视觉与深度学习实战-以MATLAB和Python为工具_基于帧间差法进行视频目标检测_项目开发案例教程.pdf

版权申诉

matlab

Python

189 浏览量 2023-04-27 15:33:56 上传评论收藏 1.16MB PDF 举报

资源推荐

资源详情

资源评论

计算机视觉与深度学习实战——以 MATLAB、Python 为工具

 234 

基于帧间差法进行视频目标检测

20.1 案例背景

运动目标自动检测是对运动目标进行检测、提取、识别和跟踪的技术。基于视频序列的运

动目标检测，一直以来都是机器视觉、智能监控系统、视频跟踪系统等领域的研究重点，是整

个计算机视觉的研究难点之一。运动目标检测的结果正确性对后续的图像处理、图像理解等工

作的顺利开展具有决定性的作用，所以能否将运动物体从视频序列中准确地检测出来，是运动

估计、目标识别、行为理解等高层次视频分析模块能否成功的关键。

运动目标检测技术在实际应用上更能体现人们对移动目标的定位和跟踪需求，因此在许多

领域都有着广泛的应用。在运输上，运动目标检测技术被用于交通管理与视频监控来智能识别

运输工具或行人的违章行为，为后续的抓拍、录入等提供了数据源；在医学上，运动目标检测

技术被用于生物组织运动分析等方面，为病理判断提供了参考依据；在场景监控等安全防范领

域，基于运动目标检测的视频监控系统与原来完全依靠人眼进行监控的系统相比，大大减轻了

监控人员的工作强度，避免了值班员主观判断所引起的漏报、误判等问题，为单位节省了人工

成本。因此，对运动目标检测技术的研究是一项既有理论意义又有使用价值的课题。近年来关

于这项课题的研究有很多，大体有帧间差分法、背景差分法和光流法等算法。其中，帧间差分

法由于运算量较小，易于硬件实现，已得到了广泛应用。

20.2 理论基础

运动目标检测算法往往是面向特定应用场景的，不存在一个算法能适用于所有场合的情况，

第 20 章基于帧间差法进行视频目标检测

 235 

也就是说每个算法都有其一定的适用范围。特别是，在同类环境下工作的各种检测算法有其特

有的优点和缺点，目前还没有一个公认的标准来衡量算法的优劣。其中，从算法应用对象的角

度来看，运动目标检测算法主要有两种：基于图像差分的算法和基于光流场的算法。其中，基

于图像差分的算法又可以分为帧间差分法和背景差分法。

20.2.1 帧间差分法

帧间差分法一般通过判断相邻两帧或若干帧图像之间像素灰度值之差是否大于某一阈值来

识别物体的运动：如果差的绝对值小于某一阈值 T，则未检测到运动目标，反之，发现运动目

标。以车辆模型运动序列为例，其帧间差分法的检测效果如图 20-1 所示。

图 20-1 帧间差分效果图

假设取相邻两帧的灰度图像 I

、I

k+1

，并且两帧之间具有良好的配准效果，图像上某个像素

点(i,j)在 k 时刻的灰度值记为 f(I,j,k)，在 k+1 时刻的灰度值记为 f(i,j,k+1)，差分图像记为 B(i,j)，

则有：

他其











  



B i j

f i j t f i j t T

1 , , , , 1





因此，差分结果

B i j,



是一个二值图像，值 1 表示该像素在不同时刻的灰度发生了很大的

变化，说明有运动物体；值 0 表示该像素的灰度没有发生变化或者变化很小，说明没有运动物

体。其中，

类似于在二值化过程中所使用的阈值，该值的选取非常关键，决定了检测目标区

域的准确度和灵敏度。

基于帧间差法进行视频目标检测的主要优点是算法简单，程序设计复杂度低，易于实现，

并且对背景或者光线的缓慢变换不太敏感，能根据帧序的移动来较快适应，对目标运动的检测

灵敏度较高。基于帧间差法进行视频目标检测的主要缺点是检测位置不够精确，特别是当目标

运动速度较快，相邻帧之间的目标运动位移较大时，会影响运动目标区域的定位及其特征参数

的准确提取。此外，帧间差分法阈值的选取对其检测结果也有直接的影响，往往决定目标检测

的区域范围。特别是，如果预先定义某阈值而不是自适应计算阈值，则会提高差分图像中运动

目标点和噪声点的误判概率。虽然帧间差分法可能提取不到完整的目标图像，但它简单、计算

量小、速度快，也容易优化，适合 DSP 实现，所以目前被广泛运用。

计算机视觉与深度学习实战——以 MATLAB、Python 为工具

 236 

20.2.2 背景差分法

背景差分法是利用当前帧图像与背景图像进行差分运算，并提取运动区域的一种目标检测

方法，该方法一般能够提供完整的目标数据。背景差分的基本思想是：首先，用预先存储或者

实时更新的背景图像序列为图像的每个像素统计建模，得到背景模型 f

(x,y)；其次，将当前每

一帧的图像 f

(x,y)和背景模型 f

(x,y)相减，得到图像中偏离背景图像较大的像素点；最后，类似

于帧间差分法的处理方式，循环前两步直至确定目标的矩形定位信息。其中，运算过程的具体

公式如下：

他其，

—，











D x y

f x y f x y T

( , )

1 | ( , ) ( , )|

式中，

f x y



为某一帧图像，

f x y



为背景图像，

D x y



为帧差图像，

为阈值。相

减值大于

，则认为像素出现在目标上，

D x y



值为 1；反之，

D x y



值为 0，则认为像素

在背景中。通过以上步骤遍历处理每个像素，能够完整地分割出运动目标。

但是，当背景图像发生长时间的细微变化时，如果一直使用预先存储的背景图像，那么随

着时间的增长，累积误差会逐渐增大，最终可能会造成原背景图像与实际背景图像存在较大偏

差，导致检测失败。因此，背景差分方法中的一个关键要素就是背景更新，自适应的背景图像

更新方法往往会大大提高目标检测的准确性及背景差分法的效率。基于像素分析的背景图像更

新是常用的背景更新算法之一，该方法在更新背景图像之前先把背景图像和运动目标区分开：

对于出现运动目标的背景图像区域不进行图像更新，对于其他区域则实时更新。因此，该算法

所得到的背景图像不会受到运动目标的干扰。但是基于像素分析的背景图像更新算法对噪声具

有一定的敏感性，特别是在光线突变时，可能不会实时更新背景图像。

背景差分法的优点是算法简单，易于实现。在实际处理过程中，在根据实际情况确定阈值

后，所得结果直观反映了运动目标的位置、大小和形状等信息，能够得到比较精确的运动目标

信息。该算法适用于背景固定或变化缓慢的情况，其关键是如何获得场景的静态背景图像，其

缺点是容易受到噪声等外界因素干扰，如光线发生变化或者背景中物体暂时移动都会对最终的

检测结果造成影响。

20.2.3 光流法

光流指图像中模式的运动速度，属于二维瞬时速度场的范畴。用光流法检测运动目标的基

本原理是：首先，为图像中的每个像素点都初始化一个速度矢量，形成图像的运动场；然后，

在运动中的某个特定时刻，将图像中的点与三维物体中的点根据投影关系进行一一映射；最后，

根据各个像素点的速度矢量特征对图像进行动态分析。在此过程中，如果在图像中没有运动目

第 20 章基于帧间差法进行视频目标检测

 237 

标，则光流矢量在整个图像区域都呈现连续变化的态势；如果在图像中存在物体和图像背景的

相对运动，则运动物体所形成的速度矢量必然和邻域背景的速度矢量不同，从而检测出运动物

体的位置。在实际应用中，光流法的计算量大，容易受到噪声干扰，不利于实时处理。

光流法在近几年得到了较大的发展，出现了很多种改进算法，常用的有时空梯度法、模块

匹配法、基于能量的分析方法和基于相位的分析方法。其中，时空梯度法以经典的 Horn&Schunck

方法为代表，应用最为普遍。该方法利用图像灰度的时空梯度函数来计算每个图像点的速度矢

量，构建光流场。假设

I x y t,,



为

时刻图像点

xy,



的灰度；

、

分别为该点光流矢量沿

和

方向的两个分量，且有

u x tdd

，

v y tdd

，则根据计算光流的条件

I x y t td , , d 0



，

可得到光流矢量的梯度约束方程为：

  I u I v I

x y t

改写为矢量形式：

  I v I

式中，

、

分别为参考像素点的灰度值沿

、

三个方向的偏导数，

I I I



为图像灰度的空间梯度，

v u v,



为光流矢量。

梯度约束方程限定了

、

与光流矢量的关系，但是该方程的两个分量

和

并非唯

一解，所以需要附加另外的约束条件来求解这两个分量。常用的约束条件是假设光流在整个图

像上的变化具有平滑性，也叫作平滑约束条件，如下所示：







    









    





v x v y

u x u y

( / ) ( / )

min

( / ) ( / )

因此，通过一系列的数学运算，可取得

uv,



的递归解。

光流法的优点是在不需要预先知道场景的任何消息的前提下能够检测独立的运动目标；光

流法的缺点是该方法在大多数情况下计算复杂度较高，容易受光线等因素的影响，导致该方法

在实时性和实用性方面处于劣势。

20.3 程序实现

运动检测算法有帧间差分法、背景差分法和光流法，已经在 20.2 节进行了具体介绍。本案

例采用的算法是较为简单的帧间差分法，利用视频序列中连续的两帧或几帧图像的差异进行目

标检测和提取。在处理过程中为了提高兼容性，选择 MeanShift 算法作为跟踪算法的补充，提

剩余23页未读，继续阅读

评论收藏

内容反馈

版权申诉

好知识传播者

粉丝: 498
资源: 4204

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于帧间差法进行视频目标检测_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于深度学习的视觉场景识别_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于深度学习的汽车目标检测_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于Simulink进行图像和视频处理_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于语音识别的信号灯图像模拟控制技术_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于块匹配的全景图像拼接_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于融合特征的以图搜图技术_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于GUI搭建通用视频处理工具_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于主成分分析的人脸二维码识别_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于小波技术进行图像融合_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于特征匹配的英文印刷字符识别_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于分水岭分割进行肺癌诊断_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于阈值分割的车牌定位识别_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于计算机视觉的自动驾驶应用_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于最小误差法的胸片分割技术_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于小波变换的数字水印技术_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于Hough变化的答题卡识别_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于不变矩的数字验证码识别_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于光流场的车流量计数应用_项目开发案例教程.pdf

计算机视觉与深度学习实战-以MATLAB和Python为工具_基于主成分分析的图像压缩和重建_项目开发案例教程.pdf

LSTM时间序列神经网络预测MATLAB代码

Matlab 基于BP神经网络的数据分类预测 BP分类

Matlab 基于支持向量机(SVM)的数据回归预测 SVM回归

ADRC控制器仿真 simulink 2017a版本

2022建模国赛代码(三天坚持不易) 包括K-meas算法、bp预测、回归预测,(python和matlab做的).zip

matlab2020b ubuntu.txt

五自由度机械臂正逆运动学matlab仿真

matlab绘制三维球面及球面曲线

基于蚁群算法的三维路径规划(matlab实现)

基于智能优化算法的双层优化求解(matlab代码)

最新资源