—31—
基于神经网络的扩展回声隐藏算法
王慧琴
1
,修可山
2
,姚钟涵
1
(1. 西安建筑科技大学信息与控制工程学院,西安 710055;2. 西安交通大学电信学院,西安 710049)
摘 要:提出了一种神经网络自适应扩展回声隐藏算法。利用 PN 序列将音频信号的单回声内核进行扩展后作为水印信号,提高了水印算
法的安全性。该算法利用了神经网络的非线性映射能力确定扩展回声内核的幅值,从而避免了复杂的心理声学模型的计算过程,实现了水
印嵌入的强度的自适应。仿真实验证明了该算法的有效性和可靠性。
关键词:音频;数字水印;神经网络;自适应;心理声学模型
Spread Echo Hiding Algorithm Based on Neural Network
WANG Huiqin
1
, XIU Keshan
2
, YAO Zhonghan
1
(1. School of Information and Control Engineering, Xi'an University of Architecture & Technology, Xi’an 710055;
2. School of Electronic & Information Engineering, Xi’an Jiaotong University, Xi’an 710049)
【Abstract】This paper proposes a neural network self-adaptive digital audio watermarking algorithm based on time-spread echo hiding algorithm.
The single echo kernel of audio signal is spread by pseudo noise (PN) sequence and taken as watermark signal. Therefore, the algorithm achieves
higher robustness and secrecy merits. By exploiting the abilities of neural networks and considering the characteristics of human audio system
(HAS), a just noticeable differences (JDN) threshold controller is designed to ensure the strength of the embedded data adapting to the host audio
itself entirely. The simulation experiment results show that the algorithm is robust to common digital audio processing methods and the quality of the
audio is guaranteed.
【Key words】Audio; Digital watermarking; Neural network; Self-adaptive; Human audio system(HAS)
计 算 机 工 程
Computer Engineering
第 32 卷 第 15 期
Vol.32
№
15
2006 年 8 月
Au
ust 2006
·博士论文·
文章编号:1000—3428(2006)15—0031—03
文献标识码:A
中图分类号:TP183
1
概述
随着网络通信的普及,许多传统媒体内容都向数字化转变,
这使得信息的存取和共享更加快捷和方便。越来越多的数字
媒体得以广泛传播,信息表达的效率和准确度也得到了显著
的提高,在电子商务中占据巨大市场份额。然而,在数字媒
体给社会带来进步、改善人们日常生活和工作的同时也暴露
出越来越严重的安全问题。例如多媒体作品的版权侵犯、软
件或文档的非法拷贝,电子商务中的非法篡改、复制和盗版
现象非常普遍,严重阻碍了媒体数字化进程和数字媒体的正
常合法使用
[1,2]
。
数字水印是一种全新的信息安全领域技术,它利用信息
隐藏技术实现对多媒体数据安全的保护。随着数字化音像制
品和音乐制品的大量制作和发行,音频数据的版权保护也显
得越来越重要,通过在音频载体中嵌入水印信息,可以实现
拷贝限制、使用跟踪、盗版确认等功能。
基于
HAS
的音频水印技术是当前该领域研究的一个重
要方面。该技术利用音频信号的主要特性,结合
HAS
的特征
解决音频数字水印的鲁棒性和不可知觉性之间的矛盾。在保
证不可知觉性前提下,在合适的位置嵌入尽可能高强度的水
印信号,使水印自适应于宿主音频信号。
水印编码可看作在强背景下迭加一个弱信号。只要迭加
的信号低于某一个阈值,听觉系统就无法感觉到信号的存在。
2
神经网络自适应扩展回声隐藏算法
算法主要包括水印生成、水印嵌入、水印提取和验证等
3
个方面。
2.1
扩展回声音频水印的生成
回声是由声源产生的声音,经反射后得到的。回声可以
通过将宿主音频信号和冲激响应进行卷积计算得到
[3]
。回声
隐藏通过在时域中引入回声将数据嵌入到音频信号中,基于
回声隐藏的数字水印算法利用了
HAS
时域掩蔽特性的向后
掩蔽特性实现水印的嵌入。向后掩蔽是指弱信号在强信号消
失之后变得无法听见。它可以在强信号消失之后
50~200ms
作用而不被人耳觉察。回声普遍存在于周围环境中,对于延
迟时间很短的回声,例如
2ms
,人类听觉系统不能够将它与
直接到达的声音分辩出来,只是感觉声音的音色发生了变化,
音色变得更丰富。回声隐藏正是利用了人类听觉系统的这种
特性达到隐藏目的。因此,回声隐藏与其它方法不同,它不
是将水印数据当作随机噪声嵌入到载体数据中,而是作为载
体数据大环境条件,对一些有损压缩的算法具有一定的
稳健性
[2,3]
。
在时域扩展回声隐藏算法中将一个伪随机序列作为回声
内核的一部分,如果用
p
(
n
)
表示
PN
序列,
a
表示
PN
序列的
幅值,则时域扩展回声内核可以表示成如下形式
[4,5]
:
10),()()( ≤
amnapnnk
(
1
)
基金项目:陕西省自然科学研究计划基金资助项目(2005F50);陕西
省教育厅产业化培育基金资助项目(02JC40)
作者简介:王慧琴(1970—),女,副教授、博士后,主研方向:网络
安全,数字水印,智能信息处理;修可山,工程师、博士生;姚钟
涵,硕士生
收稿日期:2006-01-17 E-mail:whq463@263.net
评论0