1
MPEG 基础理论
和协议分析
(包括DVB和ATSC)的指南
2
第一部分 MPEG 的介绍……………………………3
1.1 整合………………………………………………3
1.2 为什么需要压缩…………………………………3
1.3 压缩的应用………………………………………3
1.4 视频压缩的介绍…………………………………4
1.5 音频压缩的介绍…………………………………6
1.6 MPEG 信号………………………………………6
1.7 需要监视和分析…………………………………7
1.8 压缩的缺陷………………………………………7
第二部分 视频压缩…………………………………8
2.1 空间性或时间性编码? …………………………8
2.2 空间编码…………………………………………8
2.3 加权………………………………………………9
2.4 遍历…………………………………………… 11
2.5 熵编码………………………………………… 11
2.6 空间性编码器………………………………… 11
2.7 时间性编码…………………………………… 12
2.8 运动补偿……………………………………… 13
2.9 双向编码……………………………………… 14
2.10 I.P和B帧画面…………………………………14
2.11 MPEG 压缩器…………………………………16
2.12 预处理…………………………………………19
2.13 MPEG 的类和级………………………………20
2.14 小波……………………………………………21
第三部分 音频压缩…………………………………22
3.1 听觉机理……………………………………… 22
3.2 亚能带编码…………………………………… 23
3.3 MPEG 第一层面……………………………… 24
3.4 MPEG 第二层面……………………………… 25
3.5 变换编码 ………………………………………25
3.6 MPEG 第三层面……………………………… 25
3.7 AC-3 ……………………………………………25
第四部分 基本数据流………………………………26
4.1 视频基本数据流句法 …………………………26
4.2 音频基本数据流……………………………… 27
目 录
第五部分 打包基本数据流(PES)…………………28
5.1 PES 数据包………………………………………28
5.2 时间标记…………………………………………28
5.3 PTS/DTS ……………………………………… 28
第六部分 节目流……………………………………29
6.1 录制和发送………………………………………29
6.2 节目流的介绍……………………………………29
第七部分 传输流……………………………………30
7.1 传输流的工作……………………………………30
7.2 数据包……………………………………………30
7.3 节目时钟参考(PCR) ……………………………31
7.4 数据包识别(PID) ………………………………31
7.5 节目专用信息(PSI)………………………………32
第八部分 DVB/ATSC 的介绍………………………33
8.1 概述………………………………………………33
8.2 再多路调制………………………………………33
8.3 服务信息(SI) ……………………………………34
8.4 误码校正…………………………………………34
8.5 信道编码…………………………………………35
8.6 内码编码…………………………………………36
8.7 数字发射…………………………………………37
第九部分 MPEG检测………………………………38
9.1 检测要求……………………………………… 38
9.2 分析传输流………………………………………38
9.3 层级观察…………………………………………39
9.4 剖析观察……………………………………… 40
9.5 句法和 CRC 分析……………………………… 41
9.6 筛选 …………………………………………… 41
9.7 定时分析 ……………………………………… 42
9.8 基本数据流检测……………………………… 43
9.9 萨尔诺夫顺应性测试数据流………………… 43
9.10 基本数据流分析…………………………………43
9.11 创建传输流………………………………………44
9.12 抖动发生…………………………………………44
9.13 DVB 检测………………………………………45
专门词汇 ………………………………………………46
3
第一部分
MPEG 的介绍
MPEG 是当今最流行的音频 /视频
压缩技术之一。这是因为它不仅
仅是一个单独的标准,而是一系
列以相似理论为基础且适合于不
同应用的标准。MPEG是运动图象
专家组的简称,它是由 ISO(国际
标准组织)就压缩专题而建立的。
MPEG可以被描述为各种简称的相
互作用。ETSI(欧洲通讯标准化协
会)称:“CAT是一个激发IRD寻找
与其使用的CA系统有关的EMM的
指针。”如果你能够理解这句话,那
么也就不再需要这本书了。
1.1 整合
鉴于很多原因,数字技术在音频和
视频领域有了很大的发展。数字信
息比较健全可靠,在编码中可基本
避免误码的发生。这就意味着在录
制中产生的损耗和传送中的损耗被
消除了。光盘是能说明这一点的第
一项消费性产品。
当光盘相对于以前的乙烯基产品在
声音质量上有明显提高时,仅仅质
量上的比较已没有意义了。真正的
意义是数字化录制和传送技术可以
使节目内容处理达到模拟方式无法
实现的程度。当音频和视频信息被
数字化后就成为数据。这些数据与
其它任何种类的数据并无什么区
别,所以数字音频和数字视频便成
为了计算机技术所涉及的领域。
计算机和音频 / 视频的结合是计算
机的发明与脉冲编码调制出现的必
然结果。数字化介质可以存储任何
类型的信息,所以我们可以很容易
地用计算机存储设备来存储数字视
频信息。非线性工作站便是这一结
合技术的第一个例子,而用模拟技
术则是无法实现的。另一个例子便
是多媒体,将音频、视频、图表、文
字和数据存储在同一介质上。这也
是在模拟领域中无法实现的。
1.2 为什么需要压缩
数字视频技术的最初成功是在后期
制作应用中,数字视频的高成本被
无限制的层次和效果能力所抵销。
然而,制作标准数字视频会产生每
秒 200 兆以上的数据,这一数据率
要求扩展存储能力和传送带宽。只
有降低存储和带宽要求,才能使用
数字视频技术,而降低这些要求也
正是压缩的目的。
压缩是一种使用较少的数据来表现
数字音频和视频信息的方法。
压缩有以下的优点:
对于给定的一段源内容而言,只需
要较小的存储量。通过高密度录
制,如使用磁带,压缩让用户能使
用小型化设备和使用电子新闻采集
仪(ENC)成为可能。磁带的出现使
压缩进一步提高,因为只需少量的
磁带便可跳过一段给定的节目内
容。另外,随着如RAM那样的高容
量介质的出现,压缩又可在新的应
用场合中使用。
在实时工作状态下,压缩技术降低
了所需的带宽。另外,压缩技术允
许在介质之间实现比实时更快的传
送,比方说在磁带和磁盘之间传送。
压缩录制格式只需较低的录制密
度,从而降低了录制设备对环境因
素和维护的敏感性。
1.3 压缩的应用
压缩技术与电视有很大的关系。交
织是一种简单的压缩形式,它使带
宽以2:1的比例降低。用色差信号代
替GBR信号是另一种压缩形式。由
于眼睛对色彩细节并不十分敏感,
所以色差信号只需要较窄的带宽。
当彩色电视广播出现时,一方面黑
白电视的频道结构必须保留,另一
方面又在发展复合视频信号。复合
视频系统,如 PAL、NTSC 和
SECAM, 都是压缩的形式,这是因
为它们在进行彩色电视广播时使用
的带宽与黑白电视中使用的带宽相
同。
4
图 1.1a 显示了在传统电视系统中,
GBR 摄像机信号被转变为用于制
作的 Y、Pr、Pb 分量信号,并通过
编码成为用于传输的模拟复合信
号。图1.1b显示了在现代电视系统
中,Y、Pr、Pb 信号经数字化,并
在制作过程中以 SDI 形式中的 Y、
Cr 、Cb 信号方式承载,再通过
MPEG编码用于传输。很显然, 广
播工作者会认为MPEG是复合视频
信号的一种更高效的替代物。另
外,MPEG 有更大的灵活性,因为
它所需的数据率可以进行调节,以
适应不同的应用场合。在较低的数
据率和分辨率下, MPEG能够用于
电视会议和电视电话。
DVB 和 ATSC( 由欧洲和美国首创
的数字电视广播标准)如果没有压
缩技术就会失去使用的可能性,因
为它们所需的带宽会太宽。压缩技
术延长了 DVD(数字视频 / 通用光
盘)的播放时间,能够在标准尺寸
的光盘中存入整部电影。压缩技术
也可以降低电子新闻采集的成本,
并且可在其它电视制作中发挥作
用。
在磁带录制中,适度压缩易于兼
容,并增加了数字 Betacam 和
Digials的可靠性。而在SX、DVC、
DVCPRO和DVCAM中,目标是小
型化。在文件服务器和网络 (特别
是用于新闻目的网络 )中使用的磁
盘驱动器中,如泰克Profile存储系
统,压缩技术降低了存储成本。压
缩技术也降低了带宽,可以使更多
的用户使用服务器。该特点对
VOD(点播视频)应用也很重要。
1.4 视频压缩的介绍
在所有实际的节目内容中有两种信
号分量:一种是异常而无法预见
的,另一种是可以预见的。异常分
量叫作熵,它是信号中的真实信
息。余下的部分叫作冗余,因为它
不是必需的。冗余可能是空间性
的,它位于画面的大片单色区域
中,相邻的象素几乎具有相同值。
冗余也可能是时间性的,它是连续
画面间相似部分使用的地方。所有
压缩系统的工作方式都是在编码器
中将熵从冗余中分离出来。只有熵
被录制或传输,而解码器则计算传
输信号中的冗余。图1.2a便显示了
这个概念。
理想的编码器会提取出所有的熵,
并仅将它们传送给解码器。理想的
解码器则会重新制作原始信号。实
际上,“理想的”是很难达到的。理
想的解码器会很复杂,并会为了使
用时间性冗余而造成很长时间的延
迟。在某些应用场合中,如录制或
播放时,某些延迟是可以接受的,
而在电视会议中则不行。在某些情
况下,非常复杂的编码器会相当昂
贵。也就是说没有一种理想的压缩
系统。
实际上,我们所用的各种编码器,
都会产生各种处理延迟和复杂性。
MPEG的特点在于它不是单个的压
缩格式,而是各种标准化编码工
具,能够灵活地组合起来以适用于
各种应用场合。所进行的编码方式
也被包括在压缩数据中,所以不论
编码器如何工作,解码器均能自动
地进行处理。
MPEG编码被分成具有不同复杂性
的几组态,每组态又可根据输入画
面的分辨率可在不同的层上加以补
充。第二部分将对组态和层进行详
细讨论。
我们有许多不同的数字视频格式,
每一种有不同的数据率。比如高分
辨率系统的数据率可能是标准分辨
率系统数据率的六倍。然而仅知道
编码器的输出比特率并不十分有
用。重要的是压缩系数,即输入比
特率对压缩比特率的比值,比如2:1
或 5:1 等等。
但是所包含的变量数量使确定合适
的压缩系数变得非常困难。图1.2a
显示的是一个理想的编码器,如果
所有熵均被传送,那么画面质量便
非常好。但是,如果为了降低比特
率而增大压缩系数,那么并非所有
熵均被传送,画面质量也就变差
了。请注意,在压缩系统中当发生
质量损耗时,说明压缩不合理 (图
1.2b)。如果可用的比特率不足,最
好通过降低输入画面的熵来回避该
区域。 这可用滤波器来实行,因滤
波引起的分辨率损耗要比压缩副产
物更容易被接受。
图 1.1
5
为了很好地辨别熵,理想的压缩器
要相当复杂。实际应用中的压缩器
出于经济上的考虑会不那么复杂,
并且必须传送更多的数据以确保承
载所有的熵。图1.2b显示了编码器
复杂性和性能之间的关系。所需的
压缩系数越高,编码器就要越复
杂。
视频信号中的熵是会变化的。录制
一个新闻发布会上的新闻发言人的
节目会有很多冗余,很容易压缩。
相反,录制的树叶在风中飘和足球
运动员不断移动的节目就没有很多
冗余(更多的是信息或熵),所以压
缩起来也就困难得多。不论是哪种
情况,如果未能传送所有熵,就会
发生质量损耗。所以我们可以选择
数据率固定的频道,但质量会发生
变化;或者选择质量固定的频道,
但数据率会变化。电讯网络操作者
根据实际的需要更倾向于使用固定
的数据率,但是在增加的延迟可被
接受的情况下,可用缓冲存储器对
熵的变化进行平均。在录制中,可
变数据率可以更容易处理。DVD便
使用可变数据率,提高了存放高难
度节目内容的光盘的速度。
帧内编码是一项利用空间性冗余或
画面中冗余的技术;而帧间编码则
是利用时间性冗余的技术。帧内编
码可以单独使用,如用于静止画面
的 JPEG 标准,或者如在 MPEG 中
那样与帧间编码一起组合起来使
用。
帧内编码依赖于典型图象中的两个
特点。首先,并非所有的空间频率
会同时出现。其次,空间频率越高
则幅度可能越低。帧内编码需要对
图象中的空间频率进行分析。该分
析是诸如弱波和 DCT(离散余弦变
换)那样的变换的目的。变换产生
描述每个空间频率大小的系数。
一般来讲,许多系数均为零,或接
近于零。这些系数可以被省略,从
而使数据率降低。
帧间编码则依赖于找到连续画面的
相似之处。如果解码器中有了一个
画面,那么下一个画面可以通过仅
仅发送画面差异来创建。当物体移
动时,画面差异会增加,但由于移
动物体在画面之间一般不大改变其
外形,所以画面差异的大小可以通
过运动补偿来抵销、如果运动可以
被度量,那么可以通过将前面画面
中的部分内容移动到新位置上的方
法来创建当前画面中的近似值。这
个移动处理过程由通过传送到解码
器中的矢量来控制。矢量传送比发
送画面差异数据所需的数据要小得
多。
MPEG能够同时处理隔行和非隔行
图象。一个图象根据时间轴被叫作
“画面”,而不论其是一场或一帧。
交织作为数字压缩的信号源并不理
想,因为其本身便是压缩技术。时
间性编码更为复杂,因为一场中的
象素在下一场中便处于不同的位
置。
运动补偿降低但并未消除连续画面
间的差异。画面差异是本身的空间
图象,并能用前面讨论过的以变换
为基础的帧内编码进行压缩。运动
补偿只是简单地降低了差异图象中
的数据数量。
时间性编码器的效率随着其能够作
用的时间跨度的增加而提高。图
1.2c 显示了如果需要高压缩系数,
就必须考虑到输入较长的时间跨
度,并将产生较长的编码延迟。很
显然,时间性编码信号很难进行编
辑,因为给定输出画面的内容可能
是以一段时间之前发送的图象数据
为基础的。制作系统不得不限制时
间性编码的程度以保证能够进行编
辑,这种限制反过来也限制了可使
用的压缩系数。
图 1.2