分布式视频编码(DVC)是一种新型的视频编码方法,特别适合于低能耗视频摄取设备,如移动摄像机和无线传感器网等。这些设备的电池能量和内存非常有限,因此需要编码算法具有低复杂度,而解码端则可以承受复杂度较高的解码算法。这种新型编码方法的出现,对传统视频编码的“高复杂度编码低复杂度解码”特点提出了挑战。
DVC的主要特点在于其框架将视频帧分为关键帧(Key frame)和Wyner-Ziv帧(WZ frame)。对关键帧采用传统的帧内编解码方法,对WZ帧采用一种“独立编码联合解码”的方式。编码端仅使用一个量化器和信道编码,只传输信道编码产生的伴随式s。而解码端则利用相邻帧的时间相关性进行解码,首先利用已解码的相邻帧产生边信息(Side information,SI),然后用边信息进行信道解码和量化重构。这样将运动估计等计算量较大的去时域相关算法从编码端转移到解码端,实现了复杂度较低的编码算法。
在DVC中,边信息的性能对于系统整体性能有着重大影响。边信息越精确,整个DVC系统的性能越好。为了提高边信息的性能,现有DVC方案利用解码端恢复的相邻帧进行运动估计内插以产生边信息。然而,由于恢复帧不准确,这会引起不准确的运动估计,最终导致边信息性能下降。
为了解决这个问题,一些学者提出了基于hash的边信息算法。编码器将当前WZ帧的某些特征表示为hash并传到解码器,解码端利用hash辅助运动估计,从而提高运动估计可靠性,并最终得到高性能的边信息。但这种方法会增加系统的码率,影响整体系统性能。
在此基础上,D. Vardoyan等人提出了一种无监督学习运动矢量的边信息生成方法,称之为期望最大化(Expectation Maximization,EM)算法。EM算法利用Wyner-Ziv码流来学习前向运动矢量。实验结果表明,EM是目前性能最好的边信息生成方法,但也是计算复杂度最高的方法。为了提高EM算法的实用性,需要在保持其性能的前提下,降低算法的复杂度。基于此动机,本研究提出了两种改进的EM算法,并通过实验验证了它们在保持率失真性能的同时,学习时间分别缩短了30%和16%。
EM算法是基于贝叶斯准则的边信息产生方法,其包含两个基本步骤:E步(Expectation step)和M步(Maximization step)。E步负责估计概率模型参数,而M步则优化这些参数。这两种改进算法主要集中在运动搜索模板和初始概率模型两方面对EM算法进行了改进。
在文章中也提到了菱形搜索模型,这是一种用于运动估计的快速搜索算法。它通过菱形方式对运动向量进行搜索,以减少搜索时间和提高搜索精度。运动估计是视频编码中的核心部分,需要找到最佳的运动向量以预测视频帧中各个宏块的运动。
此外,文章还涉及到了期望最大化算法(EM)的优化方法。EM算法在很多领域都有应用,尤其是在包含隐变量的统计模型中。它是一种迭代方法,用于寻找概率模型参数的最大似然估计。EM算法的每一步都在提高模型对于观测数据的似然度,直到找到收敛的参数估计。
文章中还提到了中图分类号(TN919.81)和文献标志码(A),这些是学术论文中用于分类和标识的常见标识。它们有助于读者和数据库系统对文章的主题和内容进行快速的定位和分类。
文章的研究得到了国家自然科学基金和山西省国际科技合作项目的支持。作者李志宏是一位副教授,其主要研究方向为数字媒体编码与加密技术。通过这些信息,我们可以了解到文章的科研背景和作者的研究方向。