本文的主题是关于高效率视频编码(HEVC)中的自适应阈值改进的速率失真优化量化(RDOQ)算法的研究。在混合视频编码标准中,如HEVC、H264/AVC和AVS,基于变换的量化是决定速率失真(RD)性能最重要的工具。通常情况下,传统视频编码器采用带有近似均匀重建量化(NURQ)的死区加均匀阈值标量量化(DZ+UTSQ)。然而,在硬决策量化(HDQ)中存在一些问题,本文提出的算法能够显著减少量化所需的计算复杂度,并解决基于上下文的熵编码引起的数据依赖问题。
为了改善编码器的速率失真性能,通常会采用速率失真优化量化(RDOQ)工具来提高编码效率。RDOQ能够带来6%-8%的比特率节省,在视频编码器如JM、x264、HM中得到了广泛的应用。RDOQ在软件实现时面临的一个问题是计算复杂度高,特别是在基于路径搜索和基于上下文的熵编码方面,该过程存在数据依赖性。
本文提出了一种快速的RDOQ算法,以更准确地估计两个候选量化级别的速率,并提高视频编码效率。算法的第一步是根据HDQ级别和变换单元(TU)中的系数位置进行候选量化级别的预选。这种候选级别的减少可以显著降低RDOQ的计算复杂度。构建了一个模型来估计两个候选量化级别之间的比特率变化。使用这个比特率变化模型,可以避免基于上下文自适应二进制算术编码(CABAC)的比特率计算的高计算复杂度,并且可以并行处理系数。实验结果表明,该算法平均可以减少54.36%的RDOQ编码时间,同时BD率损失不超过0.88%。
在介绍部分,作者提到了基于变换的量化是决定RD性能的关键因素,并指出传统视频编码器采用的量化方法,以及HDQ的局限性。然后,作者提出了他们的研究目标,即减少计算复杂度,并介绍了他们的研究内容。
在自适应阈值改进的RDOQ算法中,有两个关键技术点,第一是如何通过硬决策量化(HDQ)级别和变换单元中的系数位置来确定候选量化级别,以此减少候选数量从而降低计算复杂性。第二是如何构建一个模型来估计两个候选量化级别之间的比特率变化,以避免基于上下文的比特率计算的高复杂性,同时实现并行处理。通过这两项改进,可以显著减少RDOQ的编码时间,而对图像质量的影响非常有限。
本文的研究工作对视频编码领域具有重要意义。随着高清视频内容的日益增长和网络带宽的压力,视频编码算法的性能直接关系到视频质量、存储空间和传输效率。HEVC作为一种新的视频编码标准,其性能比以往的标准如H.264/AVC有了显著的提升,这使得HEVC在全球范围内得到了快速的发展和应用。但是HEVC算法本身也具有较高的复杂度,因此在不显著降低视频质量的前提下,对HEVC算法进行优化以减少编码时间是一个重要的研究方向。
由于视频编码领域的竞争非常激烈,新技术和算法的研发非常频繁。本文中提出的改进RDOQ算法如果能够有效减少编码时间,并且在实际应用中效果显著,那么它将有望被集成到未来的视频编码器中,从而推动整个视频编码技术的发展。同时,作者还提到,本文的研究结果在不高于0.88%的BD率损失下,可以显著提升编码效率,这一点对于保持视频质量的重要性不言而喻。