没有合适的资源?快使用搜索试试~ 我知道了~
视频编码基础(H.264)
5星 · 超过95%的资源 需积分: 10 10 下载量 90 浏览量
2012-04-30
12:09:41
上传
评论 2
收藏 2.34MB PDF 举报
温馨提示
试读
31页
本书以 H.264/AVC 作为分析基础,不讲解代码实现,不抄袭已有作品,只求讲清楚以前书本上没有说明,或者是我读书的时候看不懂的部分。很多地方是独立思考的一家之言,请大家以挑剔的眼光看待这些论述,如有疏漏不妥,也请及时斧正。
资源推荐
资源详情
资源评论
1
视频编码基础
版本 0.98
Dipl.-Ing. Long Mingkai(不屈号的航海长)
2
前言
最近刚在公司完成了视频编码器的一个系列讲座,在此期间由于编码器开发团队的需求一直
想招募新人,却未能如意,所以想把我最近的讲座经验和面试心得跟大家分享一下,写成一
本小书。
本书以 H.264/AVC 作为分析基础,不讲解代码实现,不抄袭已有作品,只求讲清楚以前书本
上没有说明,或者是我读书的时候看不懂的部分。很多地方是独立思考的一家之言,请大家
以挑剔的眼光看待这些论述,如有疏漏不妥,也请及时斧正。
本书提到的 H.264 标准以 2010 年 3 月的版本为准。以下三本书[1][2][3]在学习 H.264 编码器
的过程中给了我很多帮助,请大家积极参考其中内容。本书内容正好补充它们一笔带过的地
方。本书不以赢利为目的,但求让读者能够更快的理解视频编码器的工作。
本作品可以以非盈利目的自由复制传播,感兴趣的朋友也可以在 QQ 群 30262778 参与更多
视频知识讨论或给我留言。本作品还将在以后根据情况逐步更新,探索更多的视频编码本质。
3
目录
第一章 数字视频基础 ............................................................................................................. 5
1.1. 逐行扫描,隔行扫描 ................................................................................................. 5
1.2. 帧编码,场编码 ......................................................................................................... 5
1.3. 评测视频质量的方法 ................................................................................................. 6
1.4. profile 和 level ....................................................................................................... 6
1.5.H.264 的码流描述 ...................................................................................................... 7
1.6 编解码框架图 ............................................................................................................... 8
1.7 无损编码 ....................................................................................................................... 8
第二章 DCT 和量化 ................................................................................................................. 9
2.1 频域信号分解 ............................................................................................................... 9
2.2 DCT 变换的特点 ............................................................................................................ 9
2.3 整数 DCT 变换 ............................................................................................................. 10
2.4 蝶形图 .......................................................................................................................... 11
2.5 量化的动态范围 .......................................................................................................... 12
2.6 Trellis ............................................................................................................................. 13
2.7 图像编码失真的由来 .................................................................................................. 13
2.8 DCT 系数的 zigzag 扫描方式(reorder).................................................................... 15
2.9 方块化产生的原因 ...................................................................................................... 15
2.10 4x4 和 8x8 块对块效应的影响 ............................................................................... 16
2.11 边界强度(BS)的确定原则 .................................................................................. 16
2.12 Deblock 是先进行水平还是垂直?为什么? ........................................................ 16
第三章 预测编码(帧内帧间) ........................................................................................... 17
3.1 H.264 的帧内编码特点 .............................................................................................. 17
3.2 帧间编码-运动估计的一般过程 ............................................................................ 17
3.3 sad 和 satd .............................................................................................................. 18
3.4 率失真优化方程 ...................................................................................................... 18
3.5 B 帧的预测过程 ....................................................................................................... 19
3.6 CBP ............................................................................................................................ 20
3.7 skip 模块和 direct 预测 .......................................................................................... 20
4
第四章 熵编码 ....................................................................................................................... 21
4.1 信息熵 ......................................................................................................................... 21
4.2 上下文信息 ................................................................................................................. 22
4.3 自适应编码 .................................................................................................................. 22
4.4 哥伦布编码 ................................................................................................................. 22
4.5 CAVLC(上下文自适应变长编码) ............................................................................... 23
4.6 CAVLC 中的幅值编码 .................................................................................................. 24
4.7 算术编码的效率 ......................................................................................................... 24
4.8 CABAC(上下文自适应算术编码) ........................................................................... 26
第五章 码率控制 ................................................................................................................... 29
5.1 码率控制的目的 ......................................................................................................... 29
5.2 视频缓存检验器(VBV ,Video Buffer Verifier) .................................................. 29
参考文献 ................................................................................................................................. 31
5
第一章 数字视频基础
1.1. 逐行扫描,隔行扫描
图 1- 1 隔行、逐行比较图
为了兼容阴极射线管(CRT)显示设备,PAL 和 NTSC 最初都是隔行标准。类似的,电影放映
也用遮光板来实现 2X 或 3X 的刷新,这相当于在电影胶片 24 FPS 的情况下,造成 48 或 72
的刷新率,才不至于有闪烁感。PAL 制的 CRT 电视机刷新率为 50,近观有很强的闪烁感,而
CRT 的电脑屏幕一般可以刷新率调到 85。
在固定刷新率的应用场合,隔行扫描的行扫描频率为逐行扫描时的一半,因而电视信号的频
谱及传送该信号的信道带宽亦为逐行扫描的一半。这样采用了隔行扫描后,在图像质量下降
不多的情况下,信道利用率提高了一倍。由于信道带宽的减小,使系统及设备的复杂性与成
本也相应减少,这就是为什么世界上早期的电视制式均采用隔行扫描的原因。
但隔行扫描也会带来许多缺点,如图 1- 1,会产生行间闪烁效应、出现并行现象及出现垂直
边沿锯齿化现象等不良效应,对于 CRT 电视机意外的设备,隔行扫描的显示效果是毫无益
处的。自从数字电视发展后,为了得到高品质的图像质量,逐行扫描也已成为数字电视扫描
的优选方案。
应该注意的是,信号的扫描方式实际上取决于摄像机采集方式,当前的 DV(digital video)
可以自由选择采用逐行还是隔行方式进行摄影采集。在不考虑 CRT 电视的场合,建议使用
逐行采集。现在的很多电视台的采集方式依然是隔行,主要是为了兼容广大存在的 CRT 用
户。
在数字视频中,例如电脑播放器,直接观看隔行采集的信号,会出现交错效应(如图 1- 1),
因此,去交错(deinterlace)算法也是视频处理中的一个研究方向。
1.2. 帧编码,场编码
由于存在隔行采集,就有场编码存在的必要性。此时,一个视频帧由两个隔行扫描的场组成,
当摄影采集的场景存在剧烈运动时,两场的相关性减小。而视频编码的目的就是依赖视频信
号中得相关性来去除数据冗余。因此,在剧烈运动的场景,以场为单位进行编码比较合适,
而在相对静态的场景中,两个场有很大的相关性,所以适宜以帧编码。
剩余30页未读,继续阅读
资源评论
- 狷狂书生2013-04-25时下很火得H264格式,文档思路清楚,学习容易!
- nosilence_20072012-12-21东西虽然比较简单,提纲式的描述,不错的
- grj8808302013-03-07内容较简单,但补充了很多系统学习中没有的东西,参考性很大
wshen1990
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 2022年各城市PM2.5, PM10, SO2, NO2等环境空气质量数据
- Golang:通过Gin框架+Redis+责任链,实现一个简单的钉钉机器人,进行消息处理 ps:多应用版
- 2021年各城市PM2.5, PM10, SO2, NO2等环境空气质量数据
- CORRUPT.navicat150-premium-cs-x64.exe
- centos7 ssh 升级至 9.6p1
- DriverMax Pro .exe
- PHP端通过modbus协议跟第三方设备进行数据通信
- navicat安装包亲测可用
- 算法部署-使用OpenVINO部署MobileStyleGAN轻量化高保真图像合成算法-项目源码-优质项目实战.zip
- 基于java实现远程采集华为逆变器使用modbus tcp协议进行通讯的设备数据
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功