第 9 章 MPEG 声音-9.3 MPEG-1 Audio
作者:多媒体吧 文章来源:网络 点击数: 更新时间:
声音编码
声音的数据量由两方面决定:采样频率和样本精度。对单声道信号而言,每秒钟的数据量位数采样频率 样本精度。要减小数据量,就需要降低采样频率或者降低样本
精度。但是人耳可听到的频率范围大约是 ~。根据奈奎斯特理论,要想不失真地重构信号,采样频率不能低于 。再考虑到实际中使用的滤波器都不可
能是理想滤波器,以及考虑各国所用的交流电源的频率,为保证声音频带的宽度,所以采样频率一般不能低于 。这样,压缩就必须从降低样本精度这个角度出
发,即减少每位样本所需要的位数。
第 章介绍了线性预测编码lpc, !的方法,这种方法主要是针对话音的编码,这种编码方法称为音源特定编码法"#"$%
&'"。( )* 和 ( )* 的声音压缩采用了另一种方法,称为子带编码s#+bc,,-!方法,这也是一种功能很强而且很有效的声音信号编码方法。与
音源特定编码法不同,,-! 不局限于只对话音进行编码,也不局限于哪一种声源。这种方法的具体思想是首先把时域中的声音数据变换到频域,对频域内的子带分量分别进
行量化和编码,然后根据心理声学模型确定样本的精度,从而达到压缩数据量的目的。
( )* 声音数据压缩的基础是量化。虽然量化会带来失真,但 ( )* 标准要求量化失真对于人耳来说是感觉不到的。在 ( )* 标准的制定过程中,( )*.# 委员会作
了大量的主观测试实验。实验表明,采样频率为 /、样本精度为 0 比特的声音数据压缩到 0+1" 时,即在 0: 的压缩率下,即使是专业测试员也很难分辨出是
原始声音还是编码压缩后的声音。
( )*.# 是一个子带编码系统,声音数据压缩算法的根据是心理声学模型,心理声学模型中一个最基本的概念是听觉系统中存在一个听觉阈值电平,低于这个电平的声
音信号就听不到。听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。大多数人的听觉系统对 ~ 之间的声音最敏感。一个人是否能听到声音
取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。
心理声学模型中的另一个概念是听觉掩饰特性,意思是听觉阈值电平是自适应的,即听觉阈值电平会随听到的频率不同的声音而发生变化。例如,在一般环境下房间里的普
通谈话可以听得很清楚,但在摇滚乐环境下同样的普通谈话就听不清楚了。声音压缩算法也同样可以确立这种特性的模型,根据这个模型可取消冗余的声音数据。( )*
.# 的压缩算法框图如图 0 所示。
图 0( )*.# 压缩算法框图
23+4.! 同样利用人的听觉系统特性来压缩声音数据,它的压缩编码算法框图如图 所示。有兴趣的读者请浏览网址:'$11"1"5$"'&3浏览日