第一方面:
MPEG-4 的独特之处在于支持基于内容的编解码,为此引入了视听对象 AVO(Audio/
VIDEO Object)的概念。AVO 可以是一幅图像中一个小提琴或琴声等,每个 AVO 可独立
编码,但相互之间又存在着时空结构关系,因此编码时,必须传送编码对象的组成结构信
息体“场景描述”,以表示场景中各 AVO 之间的时空结构关系。解码时根据此“场景描述”对
图像和声音的有关内容进行编辑和操作。视听对象还可以是一个矩形帧,从而使 MPEG-4
兼容原来的 MPEG 标准。视听对象中的视频对象 VO 通常由 3 类信息来描述,即运动、形
状和纹理信息。
1 编码原理
MPEG-4 编码器主要由形状编码、纹理编码和运动编码三部分组成。帧格式分为 I-
VoP,P-VOP 和 B-VOP。这里只讨论 I-VOP 和 P-VOP。I-VOP 采用纹理编码来消除一帧
图像数据间的空间冗余度;P-VOP 是参考前一帧图像,并采用两种参数来编码。一种是当
前要编码的图像与参考图像之间的差值;另一种是运动矢量。编码器的具体结构模块如图
1 所示。
1.1 形状编码
形状编码主要用于记录从图像序列中提取 VOP 的形状信息,该信息分为二值形状信息
和灰度形状信息。二值形状信息用 0 和 1 两个值表示 VOP 的形状;灰度形状信息用 0~
255 表示 VOP 区域的不同透明度。在编码时,当提取的 VOP 具有非矩形形状时,需要对
其进行边界扩展,使其矩形边界都是 16 的倍数,同时保证扩展后的面积最小,然后进行
形状编码;当提取的 VOP 为矩形时(矩形的长度和宽度都是 16 的倍数),形状编码就会被
屏蔽。
1.2 纹理编码