在视频编码领域,随着技术的发展,编码标准不断更新以适应更复杂多变的视频内容。在MPEG-1到HEVC的演变中,编码技术变得越来越灵活,以匹配视频块的各种纹理特征,并提高编码效率。在最新的视频编码标准HEVC中,采用了基于递归四叉树的编码单元(CU)结构,这增加了块深度的数量,提供了更好的压缩性能,但同时也导致了计算负载的大幅增加。为了应对这一挑战,研究人员提出了两阶段的快速编码单元大小决策方法。
在HEVC标准中,编码器使用一种基于四叉树的编码单元(CU)结构来适应图像的各种纹理特征。编码单元可以进一步细分为4x4的预测单元(PU)和变换单元(TU)。然而,每个CU深度层都需要完整的率失真优化(RDO)过程来决定最优的CU划分,这极大地增加了计算复杂性。为了减少计算量,提出了快速CU大小决策方法。
首先阶段,研究者提出利用加权方差和四个子CU的Hadamard成本的最大值的组合来代表CU的复杂性,并将每个CU分类为三种类型:复杂、同质和未确定。前两种类型的CU将分别作出早期分割和剪枝决策。在第二阶段,采用基于改进的SATD估计的率失真(R-D)成本来决定是否应该对之前未确定的CU进行早期剪枝。研究显示,相比于参考软件HM13.0,提出的快速CU大小决策方法在HEVC视频测试条件下提供了高达49%的时间减少,而仅有轻微的图像质量下降。此提议已被采用,用于为覆盖超过1亿用户的UC移动浏览器提供服务器端的HEVC视频和图片编码服务。
文中提到的HEVC编码标准中,CU结构是用于适应图像的纹理特性的一种灵活方式。CU可以有多种大小,从64x64到8x8,并且每个CU可以被进一步细分为4x4的PUs和TUs。这种结构在每个CU深度层的RDO(Rate-Distortion Optimization)处理中需要大量的计算来确定最优的CU划分。
四叉树编码单元结构带来的挑战是在决定最优CU划分时的计算复杂性。文章中提到的两阶段快速CU大小决策方法通过减少必要的计算量来应对这一挑战。在第一个阶段,通过加权方差和Hadamard成本最大值的组合来评估CU的复杂性,并对CU进行分类。在第二个阶段,利用改进的SATD方法来预估R-D成本,决定是否对尚未决策的CU进行早期剪枝。
SATD(Sum of Absolute Transformed Differences)是一种度量不同块间差异的方法,而R-D成本是编码过程中考虑率(编码所需比特数)和失真(图像质量损失)的优化目标。通过结合这两个概念,在不牺牲太多质量的情况下,快速做出决策,从而减少计算量。
该论文提出的方法已经被应用在服务器端,支持UC移动浏览器的HEVC视频和图片编码服务。这表明该方法在实际应用中具有有效性和实用性,能够帮助支持大量用户使用的服务商在服务器端进行高效的视频编码。