Linux音频编程指南资源-CSDN文库

Linux音频编程指南

ALSA

3星 · 超过75%的资源需积分: 32 75 浏览量 2010-11-10 22:59:08 上传评论收藏 122KB DOC 举报

资源推荐

资源详情

资源评论

Linux 音频编程指南

简介：虽然目前  的优势主要体现在网络服务方面，但事实上同样也有着

非常丰富的媒体功能，本文就是以多媒体应用中最基本的声音为对象，介绍如

何在  平台下开发实际的音频应用程序，同时还给出了一些常用的音频编

程框架。

一、数字音频

音频信号是一种连续变化的模拟信号，但计算机只能处理和记录二进制的数字

信号，由自然音源得到的音频信号必须经过一定的变换，成为数字音频信号之

后，才能送到计算机中作进一步的处理。

数字音频系统通过将声波的波型转换成一系列二进制数据，来实现对原始声音

的重现，实现这一步骤的设备常被称为模数转换器（）。 转换器以每

秒钟上万次的速率对声波进行采样，每个采样点都记录下了原始模拟声波在某

一时刻的状态，通常称之为样本（），而每一秒钟所采样的数目则称

为采样频率，通过将一串连续的样本连接起来，就可以在计算机中描述一段声

音了。对于采样过程中的每一个样本来说，数字音频系统会分配一定存储位来

记录声波的振幅，一般称之为采样分辩率或者采样精度，采样精度越高，声音

还原时就会越细腻。

数字音频涉及到的概念非常多，对于在  下进行音频编程的程序员来说，

最重要的是理解声音数字化的两个关键步骤：采样和量化。采样就是每隔一定

时间就读一次声音信号的幅度，而量化则是将采样得到的声音信号幅度转换为

数字值，从本质上讲，采样是时间上的数字化，而量化则是幅度上的数字化。

下面介绍几个在进行音频编程时经常需要用到的技术指标：

 采样频率

采样频率是指将模拟声音波形进行数字化时，每秒钟抽取声波幅度样本

的次数。采样频率的选择应该遵循奈奎斯特（）采样理

论：如果对某一模拟信号进行采样，则采样后可还原的最高信号频率只

有采样频率的一半，或者说只要采样频率高于输入信号最高频率的两倍，

就能从采样信号系列重构原始信号。正常人听觉的频率范围大约在

 之间，根据奈奎斯特采样理论，为了保证声音不失真，

采样频率应该在  左右。常用的音频采样频率有

、、、 、!"、、

 等，如果采用更高的采样频率，还可以达到 # 的音质。

 量化位数

量化位数是对模拟音频信号的幅度进行数字化，它决定了模拟信号数字

化以后的动态范围，常用的有  位、 位和  位。量化位越高，信号

的动态范围越大，数字化后的音频信号就越可能接近原始信号，但所需

要的存贮空间也越大。

! 声道数

声道数是反映音频数字化质量的另一个重要因素，它有单声道和双声道

之分。双声道又称为立体声，在硬件中有两条线路，音质和音色都要优

于单声道，但数字化后占据的存储空间的大小要比单声道多一倍。

回页首

二、声卡驱动

出于对安全性方面的考虑， 下的应用程序无法直接对声卡这类硬件设备

进行操作，而是必须通过内核提供的驱动程序才能完成。在  上进行音频

编程的本质就是要借助于驱动程序，来完成对声卡的各种操作。

对硬件的控制涉及到寄存器中各个比特位的操作，通常这是与设备直接相关并

且对时序的要求非常严格，如果这些工作都交由应用程序员来负责，那么对声

卡的编程将变得异常复杂而困难起来，驱动程序的作用正是要屏蔽硬件的这些

底层细节，从而简化应用程序的编写。目前  下常用的声卡驱动程序主要

有两种：$%% 和 %。

最早出现在  上的音频编程接口是 $%%（$%&'%），它由

一套完整的内核驱动程序模块组成，可以为绝大多数声卡提供统一的编程接口。

$%% 出现的历史相对较长，这些内核模块中的一部分（$%%(）是与

 内核源码共同免费发布的，另外一些则以二进制的形式由 (&

)*+&&, 公司提供。由于得到了商业公司的鼎力支持，$%% 已经成为在

 下进行音频编程的事实标准，支持 $%% 的应用程序能够在绝大多数声卡

上工作良好。

虽然 $%% 已经非常成熟，但它毕竟是一个没有完全开放源代码的商业产品，

%（'-*'%&'*+*）恰好弥补了这一空白，它是

在  下进行音频编程时另一个可供选择的声卡驱动程序。% 除了像

$%% 那样提供了一组内核驱动程序模块之外，还专门为简化应用程序的编写提

供了相应的函数库，与 $%% 提供的基于 &* 的原始编程接口相比，% 函

数库使用起来要更加方便一些。% 的主要特点有：

 支持多种声卡设备

 模块化的内核驱动程序

 支持 %./ 和多线程

 提供应用开发函数库

 兼容 $%% 应用程序

% 和 $%% 最大的不同之处在于 % 是由志愿者维护的自由项目，而 $%%

则是由公司提供的商业产品，因此在对硬件的适应程度上 $%% 要优于 %，

它能够支持的声卡种类更多。% 虽然不及 $%% 运用得广泛，但却具有更加

友好的编程接口，并且完全兼容于 $%%，对应用程序员来讲无疑是一个更佳的

选择。

回页首

三、编程接口

如何对各种音频设备进行操作是在  上进行音频编程的关键，通过内核提

供的一组系统调用，应用程序能够访问声卡驱动程序提供的各种音频设备接口，

这是在  下进行音频编程最简单也是最直接的方法。

!访问音频设备

无论是 $%% 还是 %，都是以内核驱动程序的形式运行在  内核空间中

的，应用程序要想访问声卡这一硬件设备，必须借助于  内核所提供的系

统调用（*）。从程序员的角度来说，对声卡的操作在很大程度上

等同于对磁盘文件的操作：首先使用 & 系统调用建立起与硬件间的联系，

此时返回的文件描述符将作为随后操作的标识；接着使用 ' 系统调用从设

备接收数据，或者使用 0 系统调用向设备写入数据，而其它所有不符合读

写这一基本模式的操作都可以由 &* 系统调用来完成；最后，使用 *& 系统

调用告诉  内核不会再对该设备做进一步的处理。

 open 系统调用

系统调用 open 可以获得对声卡的访问权，同时还能为随后的系统调用做好准备，

其函数原型如下所示：

&1*&*+2+34,3

&'56

参数 + 是将要被打开的设备文件的名称，对于声卡来讲一般是

'-'。参数 4, 用来指明应该以什么方式打开设备文件，它可以

是 $78$9、$7:8$9 或者 $78:8，分别表示以只读、只写

或者读写的方式打开设备文件；参数 &' 通常是可选的，它只有在指

定的设备文件不存在时才会用到，指明新创建的文件应该具有怎样的权

限。

如果 & 系统调用能够成功完成，它将返回一个正整数作为文件标识

符，在随后的系统调用中需要用到该标识符。如果 & 系统调用失败，

它将返回;，同时还会设置全局变量 &，指明是什么原因导致了错

误的发生。

 read 系统调用

系统调用 read 用来从声卡读取数据，其函数原型如下所示：

'1<'3*+2=<37*&56

参数 <' 是设备文件的标识符，它是通过之前的 & 系统调用获得的；

参数 =< 是指向缓冲区的字符指针，它用来保存从声卡获得的数据；参

数 *& 则用来限定从声卡获得的最大字节数。如果 ' 系统调用成

功完成，它将返回从声卡实际读取的字节数，通常情况会比 *& 的值

要小一些；如果 ' 系统调用失败，它将返回;，同时还会设置全局

变量 &，来指明是什么原因导致了错误的发生。

 write 系统调用

系统调用 write 用来向声卡写入数据，其函数原型如下所示：

701<'3*&*+2=<37

*&56

系统调用 0 和系统调用 ' 在很大程度是类似的，差别只在于

0 是向声卡写入数据，而 ' 则是从声卡读入数据。参数 <' 同样

是设备文件的标识符，它也是通过之前的 & 系统调用获得的；参数

=< 是指向缓冲区的字符指针，它保存着即将向声卡写入的数据；参数

*& 则用来限定向声卡写入的最大字节数。

如果 0 系统调用成功完成，它将返回向声卡实际写入的字节数；如

果 ' 系统调用失败，它将返回;，同时还会设置全局变量 &，来

指明是什么原因导致了错误的发生。无论是 ' 还是 0，一旦调用

之后  内核就会阻塞当前应用程序，直到数据成功地从声卡读出或

者写入为止。

 ioctl 系统调用

系统调用 ioctl 可以对声卡进行控制，凡是对设备文件的操作不符合读/写基本模式

的，都是通过 ioctl 来完成的，它可以影响设备的行为，或者返回设备的状态，其

函数原型如下所示：

&*1<'3356

参数 <' 是设备文件的标识符，它是在设备打开时获得的；如果设备比较

复杂，那么对它的控制请求相应地也会有很多种，参数  的目的

就是用来区分不同的控制请求；通常说来，在对设备进行控制时还需要

有其它参数，这要根据不同的控制请求才能确定，并且可能是与硬件设

备直接相关的。

剩余16页未读，继续阅读

评论收藏

内容反馈

老衲不出家

2012-11-15

纯粹复制人家的文章给自己拿来卖
speed_wu

2013-03-27

感觉写的比较详细的。

zhenwenxian

粉丝: 797
资源: 773

Linux音频编程指南

Linux音频编程.pdf

收集的linux音频编程文档

Alsa音频编程【精华】.pdf

ES8388/8323 datasheet 及 驱动文件（Linux4.4中调试完成正常使用）

ES8388驱动.zip

es8388数据参考手册.rar

es8388数据手册（最新）

es8388_es8388_

Android 4 游戏编程入门经典（英文完整版）

新版Android开发教程.rar

音视频编码解码资料(花钱购买)

OPhone应用开发权威指南(黄晓庆)

Android程序设计基础

ES8388 DSCodec顺芯15112476010莫先生.pdf

ES8388-DS codec datasheet

vc++ 应用源码包_6

vc++ 应用源码包_5

vc++ 应用源码包_3

vc++ 应用源码包_1

vc++ 应用源码包_2

mini2440用户手册

max30102实战资料，全部免费开源，包含硬件设计，下位机程序，上位机程序，结构设计

VMware Workstation 16虚拟机安装包

Ubuntu微信Linux版（非Wine版）

FinalShell安装包，让用户通过SSH、Telnet或者RDP等协议连接到远程服务器或设备，实现远程控制和管理

iStoreOS-PassWall

vdhcoapp 2.0.19 linux版本，配合video downloadhelper使用

黑白群晖 DSM7.X 监控套件 SurveillanceStation-x86-64-9.1.1-10728 学习版

Kylin-Server-V10-SP3-General-Release-2212-X86-64.7z.001

最新资源

ES8388/8323 datasheet 及驱动文件（Linux4.4中调试完成正常使用）