没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
运动估计算法优化技术研究与应用
第1章综述
第1章综述
近年来,随着网络通信技术和多媒体传输技术的飞速发展,图形图像、视频
处理和计算机网络技术日趋融合。由于人眼对运动物体比对静止物体更加感兴
趣,所以对运动图像的分析和处理也越来越引起人们的浓厚兴趣。运动估计是数
字视频处理和计算机视觉领域的一个非常重要的分支,它在视频监控、视频压缩
编码、人工视觉、目标跟踪等多个领域都有相当广泛的应用。因此,对运动估计
算法的研究具有十分重要的意义。
1.1研究背景
早在视频图像出现的时候,人们就已经意识到视频信号在时间域上存在着冗
余,多年以来,人们一直不断在数字图像压缩的领域进行研究,并在理论和实际
应用中都取得了很大的成果,目前在视频编码技术中主要包括三大类:运动补偿
以去除时间域的冗余;变换编码以去除空间域的冗余;熵编码以去除统计上的冗
余。运动估计的作用就是要尽量使预测的运动矢量精确,以减少帧与帧之间的冗
余,并使重建的图像接近原始图像。
表1.1冗余类型及压缩方法
冗余类型
产生原因 压缩方法
空间冗余
帧内相邻像素间的线性相关性
预测编码和变换编码
时间冗余
帧间像素之间的相关性
运动估计和运动补偿
统计冗余
每个像素值都用相同的比特数表示
熵编码
视觉冗余
人眼对亮度信号的视觉敏感性不同
量化
目前,国际电信联盟(ITU)和国际标准化组织(ISO)公布的视频压缩编
码标准有MEPG系列以及H.26x系列。这些压缩标准的实现,首先是要去除视
频序列中的空间和时间上的冗余。DCT变换是一种无损恢复的可逆数学变换,
所以经常被用在去除视频信号的空问冗余上;在去除视频信号的时间冗余上,则
是通过运动估计和运动补偿来完成。由于运动估计中的块匹配法在算法时间复杂
运动估计算法优化技术研究与应用
第1章综述
度和预测精度上都有较好的表现,故目前的视频压缩算法如:MEPG.1,MEPG.2,
MEPG-4以及H.264等都采用基于块匹配的运动估计算法来进行运动矢量的预
测。因此,寻找更加快速,更加精确的块匹配运动估计算法,仍然是人们不断努
力追逐的目标。
1.2基于块匹配的运动估计技术概述
块匹配(block-matdmg)算法【习是使用最广泛的运动估计算法,已被许多视频
编码标准如MPEG-1、MPEG-2以及H.26、H.262、H.263等所采用。相对于其它
算法,如光流法(optical缸ow)【4】及像素递归法(pcl.reeursive)t51,块匹配算法的计算
复杂性最低。
基于块匹配的运动估计方法,假设图像序列的最小运动单位是若干相邻像素
的集合(tlp块,Block)。根据先验的运动模型在相邻帧问进行全匹配,计算最优匹
配下的块运动参数,从而得到运动场的粗略估计。此方法的精度与速度依赖于运
动模型和匹配算法的选取。
1.2.1基于块匹配的运动估计算法的研究点
基于块匹配的运动估计算法的性能取决于以下三个因素:1.搜索策略;2.匹
配准则;3.搜索范围参数。其复杂度亦由上述三个因素决定。显然,通过选择适
当的搜索策略、减少匹配准则的复杂性或缩短搜索距离可以降低块匹配算法的复
杂性。这就决定了基于块匹配的运动估计算法研究必须解决以下几个问题:
(1)搜索起点的选择
由于参考帧所对应的原点往往不是最优匹配点所在的位置,所以为了缩小且
标的搜索范围,缩短搜索起点与最有匹配点之间的距离,许多算法都采用了某种
方法预测目标在下一时刻可能出现的位置,并以其作为搜索范围的原点。
2
运动估计算法优化技术研究与应用
第1章综述
(2)匹配准则
为了检测当前帧中的匹配块与参考帧中候选块的相似度,必须定义一定的匹
配准则。常用的匹配准则有几种:平均平方误差(MeanSquareError,MSEl,平
均绝对误差(MeanAbsolute
Difference,MAD)和归一化互相关函数(Normalized
Cross
Correlation
Function,NCCF)。因为不需要乘法运算,平均绝对误差MAD
是最常用的匹配准则。但这些匹配准则通常要求块内所有像素都参与计算,研究
者们从抽样定理得到启发,运用在搜素区内只选取部分搜索点进行运动估计的思
路,从块内选取一定数量的像素来计算MSE或MAD也达到了相同的效果,这样
做最直接的好处是减小了计算量,提高搜索速度。
(3)块匹配算法(BMA)
全搜索法是最直接的块匹配算法,它通过对搜索窗中所有测试点的检查来获
得最优匹配点的运动矢量。全搜索算法虽然可以获得最精确的运动矢量,但由于
计算复杂性高,所以并不实用。对于有n个点的块进行全搜索时,计算复杂度是
o(n)。为了降低全搜索算法的计算复杂度,研究者们提出了很多减少搜索窗尺寸
或测试点数目的块匹配算法。最常用的方法有三步搜索法(three-step
algorithm)161,
二维对数搜索法(two-dimension
logarithmic
search
algoritllIn)川以及多层块匹配算
法((hierarchical
block-matching
algorithm)嘲。它们将计算复杂度降至数量级
O(109n),利用合适的硬件可以实时实现的。因此这些算法己成为发展新算法的
基准。
1.2.2块匹配算法的研究动向
目前,研究者们基于这些成熟的算法,提出了一些新的混合搜索算法【9l。它
们的主要思想是首先对目标的运动类型进行预测,使用预先定义的阈值判断其是
否为静态,接着利用合适的搜索策略得到最佳匹配运动矢量。由于这种思路适用
于不同的搜索策略,因此在真实世界的视频序列运动估计中得到广泛的应用。
另一些减少检测点数目的算法是在计算块匹配误差(block
distortion
mcasl.tro,
BDM)时使用中途停止(hal所ay.咖D1删技术。在这种算法中,候选块的部分变形
3
运动估计算法优化技术研究与应用
第1章综述
(thepartial
distortion)被与当前块的最小总变形相比较。如果候选块的部分变形大
于当前块的最小总变形,则该矢量不满足要求。这些算法中的比较运算较之于
MAD匹配准则中的乘法运算,代价是相当低的,因而可以大大减少匹配准则的
计算复杂度。
尽管研究者们己经提出了很多基于块匹配的运动估计算法,但由于理论和实
际中所存在的难于解决的问题,使得实时实现运动参数估计及精确估计运动参
数,始终是基于块匹配的运动估计问题所固有的困难。自从运动估计技术的研究
开展以来,人们就在不遗余力地寻找克服这些困难的办法,并且提出了许多快速
块匹配算法,但时至今日,令人遗憾的是仍没有找到满意的最佳方案。进入九十
年代后,随着计算机、仿生学、分形学、数理统计学、计算机视觉等多门与运动
估计密切相关的学科的迅速发展,运动估计领域出现了许多新的研究方向,它们
或许会为克服甚至彻底解决这些困难提供一个契机,未来的研究方向将集中在以
下几个方面。
(1)基于视频对象的运动估计研究
MPEG-4采用现代图象编码方法,利用人眼的视觉特性,抓住图象信息传输
的本质,从轮廓.纹理的思路出发,支持基于视觉内容的交互功能。而实现基于
内容交互功能的关键在于基于视频对象的编码,为此MPEG-4引入了视频对象面
VOP的概念。这一概念根据人眼感兴趣的一些特性如形状、运动、纹理等,将
图像序列中每一帧中的场景,看成是由不同视频对象VOP(Video
Object
Plane)所
组成的,而同一对象连续的VOP称为视频对VO(Vidoa
Object),因此要求研究
基于视频对象的运动估值算法,这里也包括全局运动估计(Global
Motion
Estimation)、前景运动物体提取、背景(spdtc)生成、处理形状(Shape)和透明
(Transparency)信息等内容的研究【lI】。
(2)多阶段的运动估计算法
为了克服全搜索法过于复杂的缺点,各类运动估计快速算法应运而生。一些
算法【12j3]减少了匹配准则的计算量,另外一些减少了搜索点【1和m,还有一些缩小
了搜索范围。但现有的运动估计技术各自存在着优势与缺陷,因此,通过方法之
4
剩余55页未读,继续阅读
资源评论
programxh
- 粉丝: 17
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功