没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐
多媒体技术
多媒体技术概述
数据无损压缩
数字声音编码
媒体的种类
感觉媒体:人能直接产生感觉
表示媒体:人为的感觉媒体(静态和动态)
表现媒体:表现和获取感觉媒体的物理设备
存储媒体:用来存放表示媒体的物理介质
传输媒体:传输表示媒体的物理介质
媒体的含义
1 存储信息的实际载体
2 表示信息的逻辑载体(静态和动态)
定义
计算机处理多媒体信息的技术,包括将信息间建立逻辑链接形成一个有交互性的系
统
实质
是将自然形式下的媒体信息数字化,然后用计算机对其加工以一种友好的方式提供
给使用者
特点
集成性
实时性
交互性
多样性
数字化
文本:书面语言的表达形式
超媒体:超文本 + 多媒体
超文本和文本的区别:一个非线性一个线性
压缩与编码
压缩:是取消或减少冗余数据的过程
编码:是用代码代替文字、符号、数据的过程
网络:节点 + 链路构成
互联网:互相连接的网络,包含因特网
因特网:使用TCP/IP协议连接在一起的计算机
多媒体
定义
融合两种及以上媒体的人机互动的信息交流和传播媒体
实质
将不同表现形式的媒体信息数字化并集成,通过逻辑链接成有机整体,同时实现交
互控制
与传统媒体的不同
数字化信号 模拟信号
主动参与 被动接受
形式多样 形式单一
多媒体计算机系统组成
硬件系统
1 主要配置
2 外部设备
3 外部设备的控制接口卡
软件系统
1 驱动软件
2 操作系统
3 数据处理软件
4 创作工具软件
5 应用软件
编码
熵编码:不考虑数据源的无损数据压缩技术
源编码:考虑数据源特性的数据压缩技术
混合编码:组合源编码和熵编码的数据有损压缩技术
万维网三项核心
1 统一资源地址(URL)
2 超文本传输协议(HTTP)
3 超链接(HyperLink)
数据可被压缩的依据
数据本身存在冗余
听觉系统的敏感度有限
视觉系统的敏感度有限
一般只有文字要无损压缩,声音和图像都可以有损压缩
冗余
人为冗余
是为了检测和恢复在数据存储或传输过程中出现的错误而添加的冗余数据
视听冗余
因为人的视听系统有限,所以有些数据可以去除
数据冗余
多余的数据
四大天王
决策量
信息量
熵
事件数的对数
确定事件发生的概率
确定事件平均发生的概率
信息熵
三大编码
香农-范诺编码
理论
压缩比的理论值
实际的压缩比
编码
按概率平分,划分
霍夫曼编码 步骤
最小的两两合并
1 先将所有的符号按出现次数划分
2 两组两组的分使每个符号都独自一组并且两组出现次数的差值尽可能小
3 按左0右1的树杈,确定每个符号的编码
编码后需要的总位数 (需要的位数是出现次数 × 分配代码所占宽度)
常规的编码方法是用2^n次方来提供所需要的代码数,香农理论是用熵来确定需要
的代码数
熵的大小表示非冗余不可压缩的信息量
算术编码
习题
声音信号数字化
声音和语音
概念:语音是声音,但声音不一定是语音
语音:300 ~ 3400 Hz
声音: 20 ~ 20000 Hz
【注】
声音的两个参数:频率 + 幅度
为啥在数据域处理信号而不在模拟域中处理信号?
1 精确,不受时间和环境的影响
2 可以实现复杂的数学运算
3 可对数字部分进行编程
模拟信号 和 数字信号
模拟信号 时间和幅度上是连续的信号
数字信号 时间和幅度上是用离散值表达的信号
-----------------------------------------------------------
离散时间信号 在特定时刻对模拟信号采样得到的数据
离散幅度信号 有限数目采样得到的幅度数值组成的信号
幅度值要取整
数字化三大看板
采样频率
采样频率由信号的最高频率决定概念
奈奎斯特理论 采样频率不低于声音信号最高频率的2倍
无损数字化 使用奈奎斯特理论采样 + 能把以数字表达的声音还原成原来的声音
量化精度
1 度量 声音波形幅度 的精确程度,用存储声音样本的位数来表示
2 精度 是 度量模拟信号 的最小单位,也称量化阶
3 样本位数的大小影响到声音的质量
4 采样精度的另一种表示方法是信号噪声比,简称信噪比
声音质量与数据率
根据频带分质量
数字录音带>激光唱片>调频广播>调幅广播>电话
衡量声音质量的方法
声音信号的带宽、信噪比、人的感觉
采样与量化
采样 在某些时刻对模拟信号进行测量取样的过程
量化 将一段模拟信号转化成离散值的过程
线性量化
非线性量化 非等间隔对信号进行量化
等间隔对信号进行量化
均匀量化 采用相等的量化间隔对采样频率进行量化
非均匀量化 对幅度到信号采用大间隔,幅度小的采用小间隔
语音编码 三大编码
波形编码
参数编码
混合编码
用数字形式精确地表示模拟信号波形
利用发音器官生成语音信号的模型,对从语音信号中抽出的语音特征参数(发声模
型、有声/无声、音量大小、音调)进行编码
综合使用波形编码和声源编码技术,组合波形特性和语音特征参数的编码方法
基本思想 使重构建语音信号的波形与原始信号的波形尽量接近
语音质量 语音编码质量最好的编码方法
波形编码
习题
四大类型
PCM 脉冲编码调制
特点
最简单
最完善
最早
最广泛
数据量最大
过程
术语
频分多路复用
概念 在同一条通信线路上使用不同频段“同时”传送多个独立信号
核心思想 将频带分成几个窄带,每个窄带传送一个信号
频分 按频率区分信号的方法
复用 是一种将若干个彼此独立的信号,合并为一个可在同一信道上同时传输的复合信号
时分多路复用
概念 在同一条通信线路上使用不同时段“同时”传送多个独立信号
核心思想
将时间分成等间隔的时段,为每个用户指定一个时间间隔,使许多用户同时使用一
条传输线路
语言信号
采样速率f=8000 Hz/s,采样周期=125 ms,称为1帧
(frame)
1帧可容纳的路数规格:24路制、30路制
24路制的帧格式
30路制的帧格式
APCM(自适应脉冲编码调制)
简述
根据输入信号的幅度或音节来改变量化阶的大小
自适应:量化阶的大小每隔几个样本改变一次
音节自适应:量化阶的大小在较长时间周期里发生变化
改变量化阶大小的方法
前向自适应 根据量化的样本值的均方来估算输入信号的幅度,并对其幅度进行编码作为边信息
后向自适应 从量化器刚输出的过去样本中提取量化阶信息,不需要传递边信息
过程
DPCM(差分脉冲编码调制)
简述 利用样本与样本之间存在冗余来进行编码的数据压缩技术
思想 根据过去样本估算出下一个样本信号幅度,并将实际信号值与其之差进行量化编码
过程
ADPCM(自适应差分脉冲编码调制)
概念 自适应特性 + 差分特性
核心
利用自适应改变量化阶大小,用小的量化阶编码小的差值,用大的量化阶编码大的
差值
使用过去的样本值估算当前输入样本的预测值,使实际样本值和预测值之间的差值
总是最小
编码和解码简化框图
彩色数字图像基础
视觉系统对颜色的感知
图像的颜色模型
图像属性和种类
JPEG压缩编码
数字图像文件格式
可见光波长 380 ~ 780 nm的电磁波
常见颜色术语
颜色模型 用数值来指定颜色的方法
颜色空间 用空间中点的集合来描述颜色的方法
RGB CMYK计算机中广泛使用的颜色模型
CRT 阴极射线管,三种波长的光结合出颜色
相加混色法(RGB相加混色模型) C(颜色)= R(红色)+ G(绿色)+ B(蓝色)
彩色图像
概述 看成有许多个点组成
像素 单个像点
像素值 颜色强度,用RGB颜色分量来表示,分量强度只有0和1
VGA适配卡 16种标准颜色对应的颜色表,每种基色用8位表示
无源物体 自身不发光
彩虹打印机 采用相减混色模型
HSL模型
H:定义颜色波长,色调
S:颜色强度,饱和度
L:渗入白光量,亮度
相减混色 三基色等量相减而得,CMY(青、品红、黄)
图像分辨率 表示一幅图片的像素数目
像素深度 存储每位像素用的位数,位数越多颜色数目越多,图像深度越深
α通道 表示彩色图像像素RGB分量外,还增加1位或几位作为属性位
真彩色和伪彩色
真彩色:通过用RGB来表示的颜色
伪彩色:RGB每个分量代表着一个彩色查找表的不同索引
矢量图和位图
矢量图
位图
概述
用一系列计算机指令描绘的图,如点、线、面、曲线、圆、矩形以及它们的组合
特点
容易变换操作图像
相同或类似图可当作图的构造图
矢量图的文件小
概述 用像素值阵列表示的图
特点
只能对图中像素进行操作
存放位图的格式称为位图格式,存储的图像是像素的数值
矢量图的位图称为图形图像或矢量图像,也称光栅图像
彩色图像
按颜色数目划分为,256色图像和真彩色图像
如每个像素用一个字节表示,640×480的图需要300KB的存储空间
如每个像素的RGB分量用一个字节表示,640×480的图需要900KB存储空间
JPEG 概述 静态数字图像数据压缩标准
两种基本压缩算法
离散余弦变换,有损
预测技术,无损
计算步骤
正向离散余弦变换
量化
Z字形编码
使用DPC,对直流系数进行编码
用行程长度编码对交流系数进行编码
熵编码
小波和小波变换
小波介绍
哈尔函数
哈尔小波变换
规范化算法
二维哈尔小波变换
概述 在有限时间范围内变化且其平均值为零的数学函数
小波变换 用小波对函数在空间和时间上进行局部分析的数学变换
小知识点
FFT快速傅里叶变换
三角函数不利于做非平稳信号分析
三角函数分界母函数后,只能看出原函数有哪些频率
尺度函数 和 小波函数 循环分解原函数
考点
选择题
填空题
多媒体计算机系统两大组成部分 硬件系统和软件系统
多媒体技术的特性 集成性、交互性
数字音频文件 WAV
问答题
衡量数据压缩技术的标准
1 压缩比大
2 算法简单、压缩解压速度快
3 数据压缩后恢复效果好,尽可能接近原始数据
Commodore公司于1985年在世界上推出的第一个多媒体计算机系统 Amiga
多媒体系统的核心软件 AVSS、AVK、Amiga Vision
MPEG-II 采用分层编码体系,提供四种技术 空间可扩展性、时间可扩充性、信噪比可扩充性、数据分块技术
数字音频信息获取与处理过程顺序 采样、A/D变换、压缩、存储、解压缩、D/A变换
某音频信号的采样频率为44.1KHz,每个样值的比特数是8位,则每秒存储数字音频
信号的字节数是
44.1 × 1000 × 8 / 1024 / 8
描述彩色的三大特征 亮度、饱和度、色调
在全电视信号中,把()的前沿作为一场的起点 奇数场同步信号
一幅静态彩色图像,分辨率为512×512,每一种颜色用8bit表示,则该图像的数据
量为
512×512×3×8 3基色
D/A转换器和矩阵变换的目的是实现 数模转换和YUV到RGB的转换
熵压缩法的说法
会减少信息量
有损压缩
不可以无失真的恢复原始数据
压缩比比较大
预测编码的说法
不是一种只能针对空间冗余进行压缩的方法
根据某一模型进行
需要将预测的误差进行存储或传输
压缩方法:DPCM、ADPCM
信息量的说法 等于数据量与冗余量之差
超文本和超媒体是以()组织各种媒体信息 网状链接形式
多媒体技术发展方向是 高分辨率、高速度化、简单化、智能化
模拟音频在时间上是 连续的、模拟的
音频文件格式 WAV、VOC、MIDI
常用彩色空间有 RGB、YUV、YIQ
图像和视频编码的国际标准是 JPEG、MPEG、H.261
基于内容检索要解决的关键技术是 多媒体特征提取和匹配、相似检索技术
多媒体技术促进了()()()的融合 通讯、娱乐、计算机
多媒体计算机可分为()()两大类 计算机电视、电视计算机
量化方法分为()() 均匀量化、非均匀量化
多媒体数据库基于内容的检索的体系结构()() 数据库生成子系统、数据库查询子系统
PAL制采用的彩色空间是(),NTSC制采用的彩色空间是() YUV、YIQ
超文本和超媒体的主要特征是()()() 多媒体化。交互性、网络结构
声音卡根据采样量化位数来分为()()() 8位、16位、32位
当采样频率等于被采样对象的最高频率2倍时,被称为() 奈奎斯特频率
超文本由()()构成网络是一个有向图 节点、链
多媒体技术主要特征()()() 集成性、交互性、多样性
HIS彩色空间中H I S 分别代表 色调、饱和度、亮度
表示图像分辨率的单位“dpi”代表(),代表传输速率的单位“bps”代表() 像素点/英寸 、比特/秒
JPEG算法具有四种操作方式()()()() 顺序编码、累进编码、无失真编码、分层编码
JPEG解码原理简化框图()()() 熵解码器、反量器、逆变换
预测编码的基本思想 将样本的实际值与预测值作差得到一个误差值,对误差值进行编码
算一张 650Mb 的光盘可以放多少分钟采用采样频率 22.05KHz、分辨率为 16
位、双声道录制的声音文件
解: 存储量(字节 /秒)=(采样频率 ×量化字长 ×声道数) /8
存储量(字节 /分)=(采样频率 ×量化字长 ×声道数 ×60)/8
= 22.05 ×1000×16×2×60/8/1024/1024= 5.04MB
一张 650Mb 的光盘可以放: 650/5.04= 129 分钟
什么是多媒体 融合两种及以上的人机互动交流和传播媒体
什么是超链接 一个链接,使一个对象可以跳转到另一个对象上
什么是超文本 是一个非线性的文档可以链接到别的文档
采样频率根据此原则来确定
样本精度为8位的信噪比等于多少分贝() 48分贝
选择采样频率为22.050kHz和样本精度为16位的录音参数。在不采用压缩技术的情
况下,计算录制2分钟的立体声需要多少MB的存储空间()
(22050*2*2*2*60)/ (1024*1024)=10.09 MB
思想 根据输入信号幅度大小来该变量化阶大小的一种波形编码技术
屏幕分辨率 显示图像的大小
一个像素的RGB分量分别用3、3、2位表示图像,该幅图像的颜色数目最多是多少
(),如果有一幅256色图像,问该图的颜色深度是多少()
256种,8位
JPEG压缩后的图像与原始图像相比,最大压缩比是多少() 24 : 1
什么是零树
是小波变换系数之间的一种数据结构。如果树根和它的子孙的小波系数的绝对值小
于某个给定的阀值T,那么这颗数就叫做零树
什么是EZW编码
如果一个小波系数被量化为0,而它存在一个子孙量化后不为0,则这个点称为孤立
零点。适应孤立零点的情况而改进的零树编码算法就称为嵌入式零树小波编码算
法,简称EZW算法
什么是电视 传输图像和声音的广播系统
什么是电视制 是传输图像和声音的方法
CWT的变换过程
离散小波变换 使用离散小波的小波变换
离散小波 连续小波通过采样的量化后的小波
连续小波变换 实际用离散数据计算,缩放因子和平移参数比较小
离散小波变换 缩放因子和平移参数均选择2j
小波重构 把分解的系数还原成原始信号的过程
判断题
解答题
数字电视基础
电视
概念 电视是捕获、广播和接收活动图像和声音的远程通信系统
特点 重视色彩感觉
电视制
概念 电视制是传输图像和声音的方法
三大类型
NTSC
PAL
SECAM
概述:1950年美国制定的彩色电视广播标准,西半球国家在用
重点:525条扫描线,隔行扫描,30帧每秒
概述:1963年德国标准,中国在用
重点:625条扫描线,隔行扫描,25帧每秒
概述:1956年法国标准
重点:625条扫描线,25帧每秒
图像扫描方式
电视扫描术语
场频/场速率:每秒扫描的场数
帧频/帧速率:每秒扫描的帧数
行频/水平行速率:每秒扫描的行数
【例】NTSC制精确的帧频是29.97 Hz,525行每帧,因此行频为29.97×525=15
734行/秒
三种类型的彩色电视信号
复合电视信号
分量电视信号
S-Video信号
*图像子采样
采样方法
1 对亮度和色彩信号采用相同的采样频率
2 对亮度和色彩信号采用不同的采样频率
图像子采样
- 对亮度采用高于色彩信号的采样频率
采样格式
4:4:4 这种采样格式不是子采样格式,它是指在每条扫描线上每4个连续的采样点取
4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,每个像素用3个样本表示
4:2:2 在每条扫描线上,每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和
2个蓝色差Cb样本,平均每个像素用2个样本表示
4:1:1 在每条扫描线上,每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和
1个蓝色差Cb样本,平均每个像素用1.5个样本表示
4:2:0 在水平和垂直方向上,每2个连续采样点上取2个亮度Y样本、1个红色差Cr样
本和1个蓝色差Cb样本,每个像素用1.5个样本表示
隔行扫描和非隔行扫描
隔行扫描 - 一帧的画面分成两次扫描,第一次扫描奇数行,第二次扫描偶数行
非隔行扫描 - 从显示屏左上角一行一行扫描到右下角
【注】 电视是隔行扫描,显示屏是非隔行扫描
音频编码标准G.722,它采用的是()编码 子带-自适应差分脉冲
BMP位图文件格式中,图像数据字节阵列是按照一种()顺序存放的 从左到右,自底向上
预测编码
不是一种只能针对空间冗余进行压缩的方法
是根据某一模型进行的
需将预测的误差进行存储或传输
压缩方法有DPCM、ADPCM
音频编码标准G.721,采用的是()编码 自适应差分脉冲
在JPEG编码过程中对AC系数使用了哪种编码方法() 行程编码
全电视信号主要由()组成 图像信号、复合同步信号、复合消隐信号
多媒体技术研究兴起于() Apple公司退出Macintosh系统机
不属于多媒体范畴() 彩色画报、彩色电视
超文本是一个()结构 非线性网状
什么时候需要使用MIDI()
没有足够的硬盘存储波形文件
用音乐拌音,而对音乐质量的要求又不是很高时
声音分类质量排行() 数字激光唱盘CD-DA > 调频广播FM > 调幅广播AM > 电话
数字视频的重要性体现在()
可以用新的与众不同的方法对视频进行创造性编辑
可以不失真地进行无限次拷贝
可以用计算机播放电影节目
多媒体的引入,对多媒体数据库会产生的影响是()
影响数据库的组织和存储方法
种类繁多的媒体类型,增加了数据处理的困难
必须增加处理长事物的能力
属于多媒体中媒体范畴的是() 图形、图像、文字、动画
信息的载体() 数值、文字、动画、图片、声音
多媒体信息的存储形式() 数字信号
汉字占用几个字节存储空间() 2个
构成位图图像的最基本单位是() 像素
位图存储容量大于矢量图 对
计算分辨率为1024×768,24位真彩色图像不经压缩的数据量是多少()
1 24位真彩色,每个像素占24bit
2 1024*768个像素点
3 转换成byte 1024*768*24/8
4 单位转换 /1024 为KB,再/1024 为MB
MPEG是数字存储()图像压缩编码和伴音编码标准 动态
在音频数字化过程中,对模拟语音信号处理的步骤是() 抽样、量化、编码
图像分辨率是指() 用像素表示的数字化图像的实际大小
我们常用的VCD、DVD采用的视频压缩编码国际标准是() MPEG
色彩的种类即()
8是颜色深度
色相
将BMP格式图像转换成JPG格式() 文件容量变小
在Flash动画制作中,一般帧速选择为() 12帧/秒
多媒体作品的信息结构形式一般是超媒体结构,超媒体结构是一种网状结构 对
矢量图形一般用于视觉设计,不适用于逼真照片或要求精细细节的图像 对
图像量化位数越大,记录图像中每个像素点的颜色种类越多 对
JPEG是静止图像数据压缩国际标准的简称 对
采样频率越高,则在单位时间内计算机得到的声音样本数据就越多,对声音信号波
形的表示也越精确
对
点阵图的优点是存储空间比较小,编辑处理的方式比较简单 错
位图的优点是占用的存储空间比较小 错
声音质量与它的频率范围无关 错
在相同的条件下,位图所占用的空间比矢量图小 错
MPEG简介
MPEG-1
数字电视标准,处理的是标准图像交换格式的电视
NTSC制 352*240 ×30帧
PAL制为352*288 × 25帧
MPEG-2
数字电视标准,是一个直接与数字电视广播有关的高质量和声音编码标准
提供位速可变性功能
MPEG-4
视听对象编码标准
数据速率低
异构网络中可靠
交互性强
MPEG-7
多媒体内容描述接口标准
用于描述各种类型的多媒体信息及它们之间的关系
MPEG-21
多媒体框架标准
为多媒体应用提供一个完整的平台
解决资源共享、知识产权和版权的管理和保护
MPEG-A 多媒体应用格式标准,集成多种MPEG技术以提供专用的格式
MPEG-B 为专用系统提供系统技术标准
MPEG-C 为专用电视提供电视技术标准
MPEG-D 为专用声音提供声音技术标准
MPEG-E 为应用程序提供下载和执行功能的多媒体中间件标准
MPEG声音
听觉系统的特性
响度感知
音高感知
掩蔽效应
听阀&痛阀
听阀
痛阀
人耳刚能听到的声音强度
人耳听起来有痛感的声音强度
1、2、3层编码分别使用了听觉系统的什么特性,声音输出速率范围是多少
1:频域掩蔽特性
2:频域掩蔽特性 + 时间掩蔽特性
3:频域掩蔽特性 + 时间掩蔽特性 + 临界频带特性
MPEG视像
电视图像数据中的冗余
写出4×4哈尔小波变换矩阵
写出矢量空间W3的哈尔小波
习题
1 什么叫真彩色和伪彩色
2 什么叫屏幕分辨率和图像分辨率
3 一个像素的RGB分量分别用3,3,2位表示图像,该幅图像的颜色数目最多是多
少?如果有一幅256色的图像,问该图的颜色深度是多少?
4 按照JPEG标准的要求,一幅彩色图像经过JPEG压缩后还原得到的图像与原始图像
相比较,非图像专家难以找出它们之间的区别,此时的最大压缩比是多少?
5 JPEG压缩编码算法的主要计算步骤是:① DCT变换,②量化,③Z字形编码,④使
用DPCM对直流系数(DC)进行编码,⑤使用RLE对交流系数(AC)进行编码,⑥嫡编码。
假设计算机的精度足够高,在上述计算方法中,哪些计算对图像的质量是有损的?哪
些计算对图像的质量是无损的?
6 什么叫做v校正?
7 什么叫做α通道?它的作用是什么?
8 PNG图像文件格式的主要特点是什么?
9 什么叫做图形(graphics)、图像(image)、位图(bitmap )和图形图像(graphical
image)?
10 通过调查、试验和分析,把BMP,GIF,JPG和PNG格式的一些特性填入下表。
颜色的度量体系
习题
1 在开拓颜色科学方面, Newton, Thomas Young,Maxwell,Munsell,Ostwald
和CIE分别做出了哪些重要贡献?
2 什么是颜色空间?对人、显示设备和打印设备,通常采用什么颜色参数来定义颜
色?
3 什么叫做颜色系统(即颜色体系)?简要说明组织和表示颜色的两种方法。
Newton:发明了颜色圆
Thomas:人眼有红、绿、蓝三个基色的接收器
Maxwell:相减混色可以覆盖整个色调
Munsell:开发第一个被广泛接受的颜色次序制
Ostwald:开发Ostwald颜色体系,用波长、纯度和亮度来映射色调、饱和度、明
度
CIE:定义了许多度量颜色的标准
颜色空间:表示颜色的一种数学方法
人:色调、饱和度、明度
显示设备:红、绿、蓝的发光量来描述颜色
打印机:青色、品红、黄色、黑色的反射和吸收来指定颜色
组织和表示颜色的方法
颜色模型
编目系统
零树
“零树”是指小波变换系数之间的一种数据结构。如果树根和它的子孙的小波系数
的绝对值小于某个给定的阈值T(threshold),那么这棵树就叫做零树。
EZW编码
如果一个小波系数被量化为0,而它存在一个子孙量化后不为0,则这个点称为孤立
零点。适应孤立零点的情况而改进的零树编码算法就称为嵌入式零树小波编码算
法,简称EZW算法
数字电视 使用数据压缩技术和数字传输技术的远程通信系统
- 是压缩彩色电视信号的一种技术
习题
对彩色图像子采样的理论依据是() 人的视觉系统具有的两种特性,去掉一些颜色信号和高频信号
图像子采样是在哪个彩色空间进行的() YCbCr颜色空间
384kbps
256~192kbps
128~112kbps
合成声音 合成器生成的声音MIDI
移动估算 计算移动矢量的过程,也就是在参考图像中查找当前编码图块匹配最佳的图块过程
移动补偿 计算当前编码图块与参考帧中的图块的像素值之差的过程
MPEG-1编码器输出的电视图像的数据率() 1.15mbps
制定MPEG-1/-2 Video标准时定义了哪几种图像?那个压缩率最高,那个最低()
帧内图像I、预测图像P、双向预测B
双向最高,帧内最低
在图像质量相同的前提下,图像压缩比才越高越好
MPEG-1的声音质量是 near-CD
5.1声道立体环绕声 3/2立体声 + LFE
- 3:前面有 左、中、右三声道
- 2:后面有 两声道
- LFE:低频音效的加强声道
MPEG-2 AAC特性
使用掩蔽特性来减少声音的数据量
通过量化噪声分散到各个子带中,用全局信号吧噪声掩蔽掉
数字视频
可拷贝
便于存储
可进行非线性编辑
可以进行压缩
视频和声音分轨
播放速度可控
优点
文件格式
AVI
ASF
RealMedia
QuickTime
MPEG
计算机与电视机是通过什么手段进行信号转换的() 颜色空间、帧格式、数据格式
亮度信号解决了彩色电视机与黑白电视机兼容问题
YUV彩色空间
YIQ彩色空间
视频转换卡 视频捕获卡、视频播放卡、电视转换卡
三大多媒体国际标准
JPEG:静态图像压缩标准
MPEG:动态图像压缩标准
H.26x:可视电话和电话会议标准
要点
在空间方向上 图像数据压缩采用JPEG压缩算法,用以减少空域冗余信息
在时间方向上 图像数据压缩采用运动补偿算法,用以减少时域冗余信息
颜色空间
RGB、XYZ、YUV、HIS、LAB、CMY
图像显示方法() 图像显示器 和 光栅扫描显示器
数字图像的获取
步骤 采样 > 量化 > 编码
结果
采样的结果:图像分辨率
量化的结果:图像所能容纳的颜色总数,即图像深度
BMP、GIF、TIFF、PNG 、PSD 、PCX、PDF
图像数据冗余
空间冗余,时间冗余,结构冗余,知识冗余,视觉冗余,图像区域相同性冗余,纹
理统计冗余
声音信号所携带的三大信息 语音、音乐、音响
计算一张 650Mb 的光盘可以放多少分钟采用采样频率 22.05KHz、分辨率为 16
位、双声道录制的声音文件。(列出公式,并写出计算过程)
公式
存储量 =(采样频率×量化字长×声道数)/8 字节/秒
存储量 =(采样频率×量化字长×声道数×60)/8 字节/分
【注】
- 量化字长也就是分辨位数
- 采样频率那些乘起来是二进制的位数,除于8变成字节数
- 字节数 除1024变 kb,kb 除1024 变mb
过程
22.05 ×1000×16×2×60/8/1024/1024= 5.04MB
一张 650Mb 的光盘可以放: 650/5.04= 129 分钟
计算采样频率 22.05 KHZ,16 位字长,双声道的音频信号播放 1 分钟,所需占用
存储器的容量为多少字节 ? (列出公式,并写出计算过程)
通常 17 寸显示器的分辨率我们设置为 1024×768,如果我们要求在这个显示器上
要显示的图像颜色达到 256 种,那么这个计算机的显卡至少需要多大的显示内存?
(列出公式,并写出计算过程)
公式 显示内存 = 分辨率 × 颜色深度 / 8 字节
过程 1024 ×768×8/8/1024/1024 = 0.75MB
【注】 - 颜色深度 = 颜色种类数化为2^n 里的n
若以 PAL制式播放 640×480 图像,每个像素用 256 色表示,则一小时的不压缩的
数据量
公式 数据量 = 一帧图像的大小(分辨率×颜色深度/8)×帧速×时间
过程 640×480×8/8×3600×25/1024/1024 = 26367MB
【注】 - 注意不同电视制的帧速
电话的采样频率为 8kHz,量化位数为 8b,声道数为 1,电话语音每小时的数据量
为
公式 数据量 =(采样频率×量化位数×声道数×声音持续时间)÷ 8(字节)
过程 (8k× 8×1×3600)÷ 8=28125(KB)≈ 27.47(MB )
CD 音响的采样频率选用 44.1kHz, 16 位二进制数量化等级, 2 声道立体声,计
算数字化后所占的存储容量。如果一首歌长度为 4 分钟,一张 CD 容量为
600MB,那么一张CD 所能存放几首这样的歌曲。
过程 600 /(44100*16*2*60*4)/8/1024/1024
一幅 512×480 像素的图像,每个像素由 24 位二进制数表示( 24b/pixel(bpp)
),对这幅图像使用压缩算法后的输出为 15KB,计算该算法的压缩比
过程
该幅图像未经压缩的大小: 512×480×24=5898240(b)=737280(B)≈
737.28(KB )
则压缩比为 737.28÷15=49
若一个数字化声音的量化位数为 16,则能够表示的声
音幅度等级是多少?
声音幅度等级为 2
16
=512 个量化等级
采用脉码调制方法( PCM)对声音信号进行编码 , 每秒钟采样 16000 次 , 每次采
样有 256 个量化级。
问每次采样需要用几位二进制数码来表示?
如果仅仅传送语音信号的话,问需要多大的数据传输速率?
过程
【注】 256个量化级 = 8位二进制码表示
16000 × 8 = 128000 bit
信息量 = 数据量 与 冗余量之差
MPEG
概述 动态图像压缩编码 和 伴音编码 标准
()是网上在线播放视频文件格式的主要压缩标准 MPEG-4
()色彩模式适合用于彩色打印和彩色印刷 CMKY
衡量数据压缩技术性能的指标()()() 压缩比、恢复效果、标准化
多媒体数据压缩编码方法可分为两大类()() 有损压缩、无损压缩
摘解码器、反量化器、逆变换
JPEG标准采用了()()和混合编码方式 预测编码、变换编码、熵编码
超文本和超媒体具有哪些特点
1 多种媒体信息
2 网状结构
3 交互特性
预测编码的基本思想是什么?
1 建立数学模型,利用以往的样本值对新的样本值进行预测
2 将样本的实际值与其预测值相减得到一个误差值
3 对误差值进行编码
数字音频采样和量化过程所用的主要硬件是() 模拟到数字的转换器(A/D转换器)
采样的频率越高,声音“回放”出来的质量也越高,但是要求的存储容量也越大 对
传统媒体处理的都是模拟信号 对
图像的压缩过程主要由三部分组成:采样部分、量化部分、编码部分 错
样本精度 = 2 ^ n 二进制数量化等级
无损
有损
有损
习题
多媒体是什么? 融合了两种及以上的人-机交互媒体的信息交流和传播媒体
超链接是什么? 两个对象间的逻辑连接,是一个对象可以跳转到另一个对象
超文本是什么? 网状的文本结构
无损压缩是什么?
有损压缩是什么?
压缩过后数据可以恢复成和原本一模一样
压缩后数据不能恢复成和原本一样
有人认为因特网就是万维网对不对?
不对,因特网是用TCP/IP协议连接在一起的网络,万维网是所有http服务器上互相
连接的超媒体文档集合
万维网三个核心部分
HTTP 超文本传输协议
URL 统一资源定位符
HTML 超文本标记语言
屏幕显示用离散量表示色彩时,采用的一种色彩调整技术
存储灰度图像时,深度可达16位
存储彩色图像时,深度可达48位,和16位α通道
图形:用数学规则画的图
图像:用像素矩阵表示的图
位图:用像素矩阵表示的图
图形图像:表示矢量图的位图
习题
SGML是什么语言?SGML语言的精华是?HTML是什么语言?HTML和SGML语言
是什么关系?
用于定义文档的结构和指示文档结构的标签
把文档的内容和样式分离开处理
超文本标记语言
HTML是SGML的一个子集
对数据、内容、信息、知识、智慧的理解?
数字记录方法
对数据的描述
对内容的解释
某些领域内的事实
知识积累后的能力
JPEG2000:渐进传输
在MPEG视像数据压缩技术中,目前利用了视觉系统的哪两种特性?
人眼对色度信号的敏感度低于亮度信号
人眼对高频信号的敏感度低于低频信号
weixin_46981554
- 粉丝: 2
- 资源: 9
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 适用于tensorflow-2.11.0 CUDA版本11.2的cuDNN8.1版本
- 5Y study学习平台2016计算机基础-综合测试(8)_哔哩哔哩_bilibili_2580252704.mp4
- (大赛作品)STM32实现的F072RB NUCLEO智能家居控制.zip
- STM32实现的数字示波器源码+数字信号处理教程、配套实例.zip
- 【cookie续续】【cookie续续】【cookie续续】
- 低功耗STM32实现的F411开发板(原理图+PCB源文件+官方例程+驱动等).zip
- 基于stm32实现的 nucleo-L476的智能灯(操作说明+源码).zip
- 基于STM32实现的 NUCLEO板设计彩色LED照明灯(纯cubeMX开发).zip
- 基于STM32实现的 的联合调试侦听设备解决方案(原理图、PCB源文件、调试工具、视频).zip
- 基于STM32实现的 人群定位、调速智能风扇设计(程序、设计报告、视频演示).zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0