在计算机科学特别是多媒体处理领域中,3D电视(3DTV)作为提供更加自然和真实视觉娱乐体验的一种新型广播范式,正受到越来越多的关注。要实现3DTV中的真实感三维服务,深度图像绘制(DIBR)技术成为了核心技术之一。DIBR涉及到生成虚拟的左右视角图像,从而产生基于参考图像序列及其相应的深度序列的3D效果。然而,在现有的2D广播基础设施上通过BDCT编码压缩并传输3D内容时,会产生压缩伪像,其中块状伪像(Blocking Artifacts)是最具代表性的,它严重降低了图像质量,给观众带来不愉快的视觉体验。
研究者Cheolkon Jung、Licheng Jiao和Hongtao Qi提出了一种使用过完备3D字典(overcomplete 3D dictionary)来减少3D图像,即包含视频和深度信息的图像中的块状伪像的新方法。该方法利用k-奇异值分解(K-SVD)算法从自然图像和深度图像生成3D字典,并估计使用压缩图像的压缩因子来利用3D字典的误差阈值。实验结果表明,该方法在减少3D图像中不受欢迎的块状伪像方面非常有效。
对于压缩伪像的基本原因,在于压缩过程中会过滤掉高频分量,从而导致各种压缩伪像的产生。压缩伪像的问题在于现有的2D广播基础设施在传输3D内容时,因为使用了BDCT编码作为图像压缩技术,这种压缩技术在减少数据量的同时也影响了图像质量。
使用过完备3D字典的方法是处理压缩伪像的一种创新方式。所谓过完备字典,指的是一个字典中包含比任何信号都可以表示的向量数多的元素,允许信号可以被稀疏表示,即用字典中少量元素的线性组合来表示。稀疏表示是信号处理中的一个核心概念,它允许通过选择少数几个原子(字典中的元素)来精确或近似地表示一个信号。这一技术在图像处理领域尤为重要,因为它可以有效地利用图像的固有结构特性来改善压缩和重建的质量。
K-SVD算法是一种常用的构建字典的方法,它基于稀疏编码和信号重建的迭代过程,能够为特定的信号集合创建一个最优的过完备字典。在这个论文中,研究者提出利用K-SVD算法从自然图像和深度图像生成3D字典,并通过使用压缩图像的压缩因子来估计误差阈值。这意味着利用图像固有的统计特性来决定使用字典的程度,优化重建过程。
此外,压缩因子的使用是为了将压缩伪像的影响考虑在内,确保字典能够针对特定压缩级别上的伪像进行优化。通过这样的方法,可以显著提升重建图像的质量,减少由压缩导致的伪像,尤其是块状伪像的出现。
该研究展示了在3D图像重建领域中,通过计算方法能够有效地改善图像质量,并提高深度感知。这表明在通过现有的2D基础设施传输3D内容时,通过适当的技术处理,可以克服兼容性上的限制,改善最终用户的观看体验。
随着多媒体技术的进步,3D电视技术在广播行业的应用前景越来越广阔,而DIBR技术在其中扮演了不可替代的角色。这一研究为未来在3DTV中提供高质量视觉体验开辟了新的道路,并为多媒体通信领域中图像处理技术的发展带来了新的视角。