没有合适的资源?快使用搜索试试~ 我知道了~
Linux音频编程指南
3星 · 超过75%的资源 需积分: 32 24 下载量 75 浏览量
2010-11-10
22:59:08
上传
评论
收藏 122KB DOC 举报
温馨提示
试读
17页
Linux音频编程指南 OSS ALSA 介绍如何在Linux平台下开发实际的音频应用程序,同时还给出了一些常用的音频编程框架。
资源推荐
资源详情
资源评论
Linux 音频编程指南
简介:虽然目前 的优势主要体现在网络服务方面,但事实上同样也有着
非常丰富的媒体功能,本文就是以多媒体应用中最基本的声音为对象,介绍如
何在 平台下开发实际的音频应用程序,同时还给出了一些常用的音频编
程框架。
一、数字音频
音频信号是一种连续变化的模拟信号,但计算机只能处理和记录二进制的数字
信号,由自然音源得到的音频信号必须经过一定的变换,成为数字音频信号之
后,才能送到计算机中作进一步的处理。
数字音频系统通过将声波的波型转换成一系列二进制数据,来实现对原始声音
的重现,实现这一步骤的设备常被称为模数转换器()。 转换器以每
秒钟上万次的速率对声波进行采样,每个采样点都记录下了原始模拟声波在某
一时刻的状态,通常称之为样本(),而每一秒钟所采样的数目则称
为采样频率,通过将一串连续的样本连接起来,就可以在计算机中描述一段声
音了。对于采样过程中的每一个样本来说,数字音频系统会分配一定存储位来
记录声波的振幅,一般称之为采样分辩率或者采样精度,采样精度越高,声音
还原时就会越细腻。
数字音频涉及到的概念非常多,对于在 下进行音频编程的程序员来说,
最重要的是理解声音数字化的两个关键步骤:采样和量化。采样就是每隔一定
时间就读一次声音信号的幅度,而量化则是将采样得到的声音信号幅度转换为
数字值,从本质上讲,采样是时间上的数字化,而量化则是幅度上的数字化。
下面介绍几个在进行音频编程时经常需要用到的技术指标:
采样频率
采样频率是指将模拟声音波形进行数字化时,每秒钟抽取声波幅度样本
的次数。采样频率的选择应该遵循奈奎斯特()采样理
论:如果对某一模拟信号进行采样,则采样后可还原的最高信号频率只
有采样频率的一半,或者说只要采样频率高于输入信号最高频率的两倍,
就能从采样信号系列重构原始信号。正常人听觉的频率范围大约在
之间,根据奈奎斯特采样理论,为了保证声音不失真,
采样频率应该在 左右。常用的音频采样频率有
、、、 、!"、、
等,如果采用更高的采样频率,还可以达到 # 的音质。
量化位数
量化位数是对模拟音频信号的幅度进行数字化,它决定了模拟信号数字
化以后的动态范围,常用的有 位、 位和 位。量化位越高,信号
的动态范围越大,数字化后的音频信号就越可能接近原始信号,但所需
要的存贮空间也越大。
! 声道数
声道数是反映音频数字化质量的另一个重要因素,它有单声道和双声道
之分。双声道又称为立体声,在硬件中有两条线路,音质和音色都要优
于单声道,但数字化后占据的存储空间的大小要比单声道多一倍。
回页首
二、声卡驱动
出于对安全性方面的考虑, 下的应用程序无法直接对声卡这类硬件设备
进行操作,而是必须通过内核提供的驱动程序才能完成。在 上进行音频
编程的本质就是要借助于驱动程序,来完成对声卡的各种操作。
对硬件的控制涉及到寄存器中各个比特位的操作,通常这是与设备直接相关并
且对时序的要求非常严格,如果这些工作都交由应用程序员来负责,那么对声
卡的编程将变得异常复杂而困难起来,驱动程序的作用正是要屏蔽硬件的这些
底层细节,从而简化应用程序的编写。目前 下常用的声卡驱动程序主要
有两种:$%% 和 %。
最早出现在 上的音频编程接口是 $%%($%&'%),它由
一套完整的内核驱动程序模块组成,可以为绝大多数声卡提供统一的编程接口。
$%% 出现的历史相对较长,这些内核模块中的一部分($%%()是与
内核源码共同免费发布的,另外一些则以二进制的形式由 (&
)*+&&, 公司提供。由于得到了商业公司的鼎力支持,$%% 已经成为在
下进行音频编程的事实标准,支持 $%% 的应用程序能够在绝大多数声卡
上工作良好。
虽然 $%% 已经非常成熟,但它毕竟是一个没有完全开放源代码的商业产品,
%('-*'%&'*+*)恰好弥补了这一空白,它是
在 下进行音频编程时另一个可供选择的声卡驱动程序。% 除了像
$%% 那样提供了一组内核驱动程序模块之外,还专门为简化应用程序的编写提
供了相应的函数库,与 $%% 提供的基于 &* 的原始编程接口相比,% 函
数库使用起来要更加方便一些。% 的主要特点有:
支持多种声卡设备
模块化的内核驱动程序
支持 %./ 和多线程
提供应用开发函数库
兼容 $%% 应用程序
% 和 $%% 最大的不同之处在于 % 是由志愿者维护的自由项目,而 $%%
则是由公司提供的商业产品,因此在对硬件的适应程度上 $%% 要优于 %,
它能够支持的声卡种类更多。% 虽然不及 $%% 运用得广泛,但却具有更加
友好的编程接口,并且完全兼容于 $%%,对应用程序员来讲无疑是一个更佳的
选择。
回页首
三、编程接口
如何对各种音频设备进行操作是在 上进行音频编程的关键,通过内核提
供的一组系统调用,应用程序能够访问声卡驱动程序提供的各种音频设备接口,
这是在 下进行音频编程最简单也是最直接的方法。
!访问音频设备
无论是 $%% 还是 %,都是以内核驱动程序的形式运行在 内核空间中
的,应用程序要想访问声卡这一硬件设备,必须借助于 内核所提供的系
统调用(*)。从程序员的角度来说,对声卡的操作在很大程度上
等同于对磁盘文件的操作:首先使用 & 系统调用建立起与硬件间的联系,
此时返回的文件描述符将作为随后操作的标识;接着使用 ' 系统调用从设
备接收数据,或者使用 0 系统调用向设备写入数据,而其它所有不符合读
写这一基本模式的操作都可以由 &* 系统调用来完成;最后,使用 *& 系统
调用告诉 内核不会再对该设备做进一步的处理。
open 系统调用
系统调用 open 可以获得对声卡的访问权,同时还能为随后的系统调用做好准备,
其函数原型如下所示:
&1*&*+2+34,3
&'56
参数 + 是将要被打开的设备文件的名称,对于声卡来讲一般是
'-'。参数 4, 用来指明应该以什么方式打开设备文件,它可以
是 $78$9、$7:8$9 或者 $78:8,分别表示以只读、只写
或者读写的方式打开设备文件;参数 &' 通常是可选的,它只有在指
定的设备文件不存在时才会用到,指明新创建的文件应该具有怎样的权
限。
如果 & 系统调用能够成功完成,它将返回一个正整数作为文件标识
符,在随后的系统调用中需要用到该标识符。如果 & 系统调用失败,
它将返回;,同时还会设置全局变量 &,指明是什么原因导致了错
误的发生。
read 系统调用
系统调用 read 用来从声卡读取数据,其函数原型如下所示:
'1<'3*+2=<37*&56
参数 <' 是设备文件的标识符,它是通过之前的 & 系统调用获得的;
参数 =< 是指向缓冲区的字符指针,它用来保存从声卡获得的数据;参
数 *& 则用来限定从声卡获得的最大字节数。如果 ' 系统调用成
功完成,它将返回从声卡实际读取的字节数,通常情况会比 *& 的值
要小一些;如果 ' 系统调用失败,它将返回;,同时还会设置全局
变量 &,来指明是什么原因导致了错误的发生。
write 系统调用
系统调用 write 用来向声卡写入数据,其函数原型如下所示:
701<'3*&*+2=<37
*&56
系统调用 0 和系统调用 ' 在很大程度是类似的,差别只在于
0 是向声卡写入数据,而 ' 则是从声卡读入数据。参数 <' 同样
是设备文件的标识符,它也是通过之前的 & 系统调用获得的;参数
=< 是指向缓冲区的字符指针,它保存着即将向声卡写入的数据;参数
*& 则用来限定向声卡写入的最大字节数。
如果 0 系统调用成功完成,它将返回向声卡实际写入的字节数;如
果 ' 系统调用失败,它将返回;,同时还会设置全局变量 &,来
指明是什么原因导致了错误的发生。无论是 ' 还是 0,一旦调用
之后 内核就会阻塞当前应用程序,直到数据成功地从声卡读出或
者写入为止。
ioctl 系统调用
系统调用 ioctl 可以对声卡进行控制,凡是对设备文件的操作不符合读/写基本模式
的,都是通过 ioctl 来完成的,它可以影响设备的行为,或者返回设备的状态,其
函数原型如下所示:
&*1<'3356
参数 <' 是设备文件的标识符,它是在设备打开时获得的;如果设备比较
复杂,那么对它的控制请求相应地也会有很多种,参数 的目的
就是用来区分不同的控制请求;通常说来,在对设备进行控制时还需要
有其它参数,这要根据不同的控制请求才能确定,并且可能是与硬件设
备直接相关的。
剩余16页未读,继续阅读
资源评论
- 老衲不出家2012-11-15纯粹复制人家的文章给自己拿来卖
- speed_wu2013-03-27感觉写的比较详细的。
zhenwenxian
- 粉丝: 797
- 资源: 773
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功