声音数字化是将连续的模拟声音信号转换为离散的数字信号的过程,这一过程保留了声音信
号的主要特征,并便于存储、传输和处理。以下是声音数字化的入门知识:
一、声音的基本概念
声波:声音是通过一定介质(如空气、水、金属等)传播的连续的波。声波的产生源于物体
的振动,这些振动会使介质中的分子产生压缩和稀疏的变化,从而形成声波。
振幅:振幅决定了声音的大小或音量,即声波的振动幅度。
频率:频率是指声波每秒钟振动的次数,用赫兹(Hz)表示。频率决定了声音的音调高低。
人耳能听到的频率范围大致在 20Hz 到 20kHz 之间。
二、声音信号的类型
模拟信号:自然界中的声音是模拟信号,它是连续的、无限的,具有无穷多的可能值。
数字信号:计算机处理的是数字信号,它是离散的、有限的,由一串有限数量的 0 和 1 数据
流组成。
三、声音数字化的过程
声音数字化的过程主要包括采样、量化和编码三个步骤:
采样:采样是按照一定的时间间隔对连续的声音信号进行取值,将原本连续的信号转换为一
系列离散的样本点。采样频率决定了每秒内采样的次数,常用的采样频率有 8kHz、16kHz、
44.1kHz 等。采样频率越高,样本点越密集,越能准确地还原原始声音信号。奈奎斯特采样
定理指出,为了不失真地恢复模拟信号,采样频率应该大于等于模拟信号频谱中最高频率的
两倍。
量化:量化是将采样得到的连续模拟信号值转换为有限个数的离散值的过程。量化过程类似
于将连续变化的量划分为若干个区间,每个区间对应一个离散值。量化位数决定了区间的数
量,常用的量化位数有 8 位、16 位等。量化位数越高,划分的区间越多,声音信号的细节
保留得越完整,声音质量也越好。但量化位数增加也会带来存储和传输成本的上升。
编码:编码是将量化后的离散值转换为计算机可识别的二进制代码的过程。所有量化后的离
散值通过二进制编码连起来,就形成了数字信号,可以存储在计算机中或进行传输。常见的
编码方式有 PCM(脉冲编码调制)、DPCM(差分脉冲编码调制)、ADPCM(自适应差分脉
冲编码调制)等。
四、声音数字化的数据量
声音数字化的数据量可以通过以下公式计算:
音频数据量 = 采样频率 × 量化位数 × 声道数 / 8(字节/秒)
其中,采样频率、量化位数和声道数都是影响音频数据量的重要因素。例如,一个采样频率
为 44.1kHz、量化位数为 16 位、双声道的 PCM 编码的 WAV 文件,其数据速率为 44.1k × 16
× 2 = 1411.2kbps,即每秒需要 1.4112MB 的存储空间。
五、音频文件的格式
音频文件有多种格式,常见的包括 WAV、MP3、WMA、MIDI 等。这些格式在压缩方式、音
质、文件大小等方面各有特点。例如,WAV 文件是未经压缩的 PCM 数据,声音层次丰富,
还原音质好,但文件数据量很大;MP3 文件则采用了高压缩比的音频压缩技术,音质优美
且文件大小相对较小。