在数字视频/图像编解码领域,速率失真(Rate-Distortion,简称R-D)分析是一个基本问题,吸引了大量的研究关注。R-D分析主要研究在适用的压缩技术下,源信号的速率和失真之间的本质属性。在实际应用中,源信号的统计特性通常由源分布来描述,而基于变换的熵约束标量量化技术则是最为广泛使用的有损压缩技术。因此,R-D分析通常通过研究将某种标量量化器应用于给定源分布时的R-D关系和R-D性能来展现。
本文针对复杂的R-D分析问题,通过分别审视源分布和量化器设计对R-D性能的影响来解决。理论上揭示了一种普遍的R-D属性:对于任何可表示为缩放因子(Scaling Factor,简称SF)及其剩余部分乘积形式的源分布,缩放因子SF并不影响其微分R-D函数。针对不同源分布推导出了高效的量化器设计原则,这些原则可以在应用带有近似均匀重建量化器的死区加均匀阈值标量量化器(Dead-Zone Plus Uniform Threshold Scalar Quantizer,简称DZ+UTSQ/NURQ)时,作为方便的R-D性能分类器和指标。这两项贡献为各种不同源的R-D分析提供了新的视角和启示,为视频/图像应用提供了坚实的理论基础。
研究中,为了准确地模拟真实的源信号,研究人员已对各种分布进行了研究。这些研究涵盖了三个类别的分布:1)广泛使用的经典分布,例如高斯分布、拉普拉斯分布和均匀分布等;2)针对特定应用场景的自定义分布;3)在理论分析和实际应用中新兴的分布。
针对源分布的R-D分析,本文还提出了一种新方法来分离和量化不同源分布的复杂性。新方法允许通过比较不同源分布下的R-D曲线,来评估哪些因素对R-D性能影响最大。此外,该方法不仅适用于已知的分布类型,而且对于具有未知或复杂分布特性的新源信号也具有适应性。
在量化器设计方面,本文提出了一种新的量化器设计框架,它包括了一个可调节的死区大小以及一个阈值选择策略,可以在不同的压缩需求和质量要求之间提供灵活性。该框架被证明可以有效地应用于多种不同的源分布,特别适合在实时或计算资源受限的环境中使用。
本文通过对不同源分布进行R-D分析,并将分析结果应用于视频和图像编解码标准的优化中,展示了其在实际应用中的潜力和价值。研究表明,通过合理地选择量化器参数和设计量化器结构,可以显著提升视频和图像信号的压缩效率和质量,这对于当前的数字媒体应用和未来的研究方向都具有重要的意义。