№ .3 陕西科技大学学报 Jun .2005
· 66 ·
JOURNAL OF S HAANXI U NIVERSIT Y OF SCIENCE & TECHNOLOGY Vol .23
磁
文章编号 :1000 - 5811(2005)03 - 0066 - 04
通 过 W in do w s 编 程 实 现 特 殊 声 音 合 成 的 方 法
丛红艳
1
,李建文
2
,马学宗
3
(1 .西安工程科技学院艺术工程学院 ,陕西 西安 710048 ;2 .陕西科技大学计算机与信息工程学院 ,陕西 咸
阳 712081 ;3 .西安工程科技学院计算机科学学院 ,陕西 西安 710048)
摘 要 :论述了特殊声音合成的过程 ,讨论了数字声音的基本特性 ,分析了 WAVE 文件的结
构和 Window s API 中声音的播放函数 ,最后着重讨论了特殊声音合成的数学方法 。
关键词 :声音合成 ;WAVE 文件 ;特殊声音
中图分类号 :T P316 .7 ;T N912 .3 文献标识码 :A
0 引言
现在的计算机都具备多媒体功能 ,包括数字声音的输入输出端口 ,同时操作系统 Window s 也提供了
许多有关数字声音的基本功能 ,如录音机和 M edia Player ,这些功能仅仅能够满足一般使用者的需求以录
制自然界已经发生的声音 。 计算机实现这种基本功能就是将声音数据保存成固定格式的磁盘文件 ,当用
户需要播放时操作系统便按照文件头部所说明的方式进行播放 。 然而 ,在科学研究中要用到的许多特殊
的声音自然界本来不存在 ,如指定频率和指定音量的声音就无法通过录制完成或录制成本太高 ,为此而需
要进行特殊声音的数字合成 。
Window s 中声音数字合成的过程主要分为 :确定数字声音的基本特性 、根据基本特性填写声音文件
的格式 、根据数学方法编辑波形数据 、调用声音 A PI 函数进行播放或结束播放等 。 本文中作者根据自己
设计特殊声音数字合成软件的过程分别论述了声音数字合成的基本方法与相关知识 。
1 数字声音数据的基本特性
用于计算机的数字化声音通常有 3 种 :(1)Compact Disc‐Digital Audio 格式 ,即我们通常所用的 CD
光盘的数字化声音 ,每秒消耗 176kB 的空间 ;(2)M usical Instrument Digital Interface 格式 ,即 M IDI ,实际
上是乐器与计算机之间的通讯协议 ,制作时需要乐器 ;(3)波形(WAVE)文件格式 ,不需要乐器也可以产
生声音 ,类似于 CD 光盘的声音 ,但比 CD 所消耗的空间少
〔1〕
。
通常我们所说的声音合成 ,特别是语音合成就是编制 WAVE 文件 。 WAVE 文件格式中的许多特性
关系着声音的播放质量 ,同时也与声音设备密切相关 。 如下是一些声音数据的特性 :
(1) 声道数 ,如单声道 、立体声 。
(2) 每个声音数据的位数 ,如 8 位 、16 位 、32 位 、64 位等 。
(3) 每秒所播放的声音数据量 ,有 8000 、11025 、44100 、48000 等 。
(4) 声音数据量 ,与具体的录制与播放时间相关 。
如单声道 、8 位 、每秒 8000 数据量的声音质量比较差 ,因为无法播放 4000Hz 以上频率的声音 。 人的
耳朵接收声音的频率范围为 20 ~ 20000Hz ,每秒所播放的声音数据量达到 44100 是比较理想的要求 。 如
果这样 ,每分钟至少需要消耗 2 .6M 字节的空间 ,如果是高质量的立体声 、32 位数据 ,则每分钟需要消耗
20 .6M 字节的空间 。
磁
收稿日期 :2004 - 12 - 31
作者简介 :丛红艳 (1976 - ) ,女 ,山东省文登市人 ,硕士 ,讲师 ,研究方向 :计算机图形 、图像处理