针对ASR系统的快速有目标自适应对抗攻击.docx资源-CSDN文库

版权申诉

184 浏览量 2022-11-28 20:31:00 上传评论收藏 56KB DOCX 举报

资源详情

资源评论

神经网络的快速发展,使其应用于多种领域,如自动驾驶、面部识别、目标

检测、语音识别和图像分类等。但是,最近的研究

[1,2,3]

已经表明神经网络容易受

到对抗样本的影响。攻击者可以通过在输入中添加一些人类不容易感知的微小

扰动,使得神经网络输出任何想要的结果。对抗样本的发现对深度神经网络在

现实生活中的应用构成了极大的安全威胁。攻击者可以通过生成对抗样本来欺

骗面部识别系统,入侵移动设备,获取相关的隐私信息;或是对道路标识符进行篡

改,促使自动驾驶汽车将右转弯的交通标志识别为笔直,由此引发交通事故。

对抗样本的研究最初主要集中在图像空间上,除了少部分目标检测,语义分

割,人脸识别和强化学习的研究内容外,大部分都是针对图像分类任务

[1]

。在其他

领域,对抗样本也有相应的研究,如:文本分类,恶意软件检测

[2]

和语音识别

[4]

等。

本文着重于语音识别领域的对抗样本攻击研究。

通常,根据攻击者攻击目标的不同,对抗攻击可以分为两种类型。一种常见

的攻击方式是找到使目标模型分类错误的最小扰动。第二,在最大允许扰动范

围内,最大化目标模型将扰动样本分类为目标类别的概率。最近,在获得具有最

小扰动的对抗样本的攻击下,CARLINI 等人

[3]

证明,对于任何音频样本,仅添加少

量扰动就可以使自动语音识别模型将音频转录为攻击者指定的任意短语。尽管

这种攻击产生的样本具有较低的噪声,但它需要进行大量的迭代,这对于实际场

景中的自动语音识别攻击是不切实际的。

为了产生使对抗扰动范数值最小的攻击,需要优化两个目标,即在模型对输

入进行了错误分类的同时还要保证尽量小的添加的扰动范数值。当前最先进的

方法 C &W

[3]

通过设计使用两个损失函数项来解决此问题,该方法攻击效果的

好坏取决于平衡两个损失函数的超参数 c 的选择。在此基础上,还需要通过大

量迭代来实现攻击。笔者提出了一种 A-FTA 方法,该方法基于最大化对抗样本

和目标类别相似度的策略。具体来说,使用投影梯度下降法来生成目标音频对

抗样本。在每次迭代中,针对每个音频值在损失函数中进行梯度下降操作,以使

损失函数最小化,同时根据样本是否具有对抗性来改变最大扰动范数值。攻击

的步长则随着迭代次数的增加而逐渐减小。最后,将生成的扰动音频映射到固

定的可行解空间中。所提出的方法可以大大减少攻击所需的迭代次数,并且还

可以避免由于扰动范数较小而导致最优解在两点之间振荡的问题。大量实验表

明,在 300 次迭代中,A-FTA 方法的攻击效果要优于现有的方法。即使仅进行

100 次迭代,依然能保证非常高的攻击成功率。

1 背景及相关工作

1.1 对抗样本

给定模型 f(·)和输入样本 x∈R

,其对应的标签 y∈R

。存在微小扰动 δ,使

得 x'=x+δ 在某个距离度量 d(x,x')中与 x 相似,但分类结果 f(x')≠y。这样的样本 x'

称为无目标对抗样本。除此之外,还有一种更强大的攻击,称为有目标对抗样本。

它不仅可以使目标模型针对 x 和 x'输出不同的结果,而且还可以使模型对输入

样本 x'误分类为特定的标签 t(由攻击者选择),即 y≠f(x')=t。在图像领域,研究人

员选择 l

距离作为 d(x,x'),最常使用 l∞距离来评估添加的扰动的大小。根据攻

击者是否对分类器 f(·)的参数和结构有足够的了解,对抗样本的攻击方法可以进

一步分为白盒攻击和黑盒攻击。在白盒攻击中,攻击者知道分类器 f(·)的所有知

识。在黑盒攻击中,除了输入和输出外,攻击者对分类器 f(·)一无所知。

为了生成对抗样本,攻击者通常需要预先设置损失函数,然后通过执行基于

梯度的优化过程来最小化损失函数。根据不同的目标,生成对抗样本的方法可

以表示为在成功攻击的前提下保证扰动模值‖δ‖最小 ,或者在最大扰动预算范

围‖δ‖≤ε 中最大化对抗样本被分类为目标类别的概率。例如,获得具有最小失真

的目标对抗样本的优化过程可以表示为

mind(x,x+δ)　　,s.t.f(x+δ)=t,x+δ∈[0,M]　　,

(1)

其中,[0,M]是有效输入的阈值范围。但是,由于约束 f(x+δ)=t,是高度非线性

的,因此,现有的基于梯度的算法很难直接求解式(1)。因此,研究人员将其表达为

更适合优化的另一种形式

[ 1,7]

,即

mind(x,x+δ)+c·l(f(x+δ),t)　　,s.t.x+δ∈[0,M]　　,

(2)

其中,c 是平衡攻击成功率和扰动 δ 大小的超参数,c>0。

还有另一个更简单的目标函数,该函数最小化模型关于对抗样本的预测与

目标标签之间的差异。与最小扰动优化不同,基于 p 范数的扰动固定为小于指

定的阈值。对应的优化公式为

minl(f(x+δ),t)　　,s.t.‖δ‖≤ε　　,

(3)

其中,ε 是预设的添加的最大扰动值。与前面的式(2)相比,此优化更为简单

有效,因为它不需要搜索其他超参数 c。

1.2 音频对抗样本

CISSE 等人

[5]

成功生成了语音对抗样本,导致 Google 的语音应用模型对输

入的音频进行了错误的转录。2018 年,针对 MOZILLA 对于 DeepSpeech 端到

端的实现

[4]

,CARLINI 等人

[3]

使用基于优化的最小扰动白盒攻击方法来构建目标

音频对抗样本,生成的样本作为输入可以被模型转录为他们想要的任何目标短

语。文献[6]通过使用“心理声学掩膜”对 KALDI 上的 ASR 系统进行了人耳难以

察觉的攻击。上述方法都直接将 wav 音频文件输入到模型中,而这在实际应用

中是不现实的。YUAN 等人

[7]

提出“CommanderSong”的方法来评估 Kaldi 模型,

并使用歌曲作为载体来构建对抗攻击,所生成的对抗样本在空气传播中也同样

有效。YAKURA 等人

[8]

生成了可以无线播放的对抗样本。该攻击对短的两个单

词或三个单词的短语非常有效,但对较长的句子短语则没有什么效果。QIN 等

人

[9]

将基于优化的最小扰动攻击与听觉掩盖的心理声学原理

[10]

结合 ,并针对

Lingvo ASR 系统

[11]

生成了难以察觉的音频对抗样本。LIU 等人

[12]

提出了加权采

样音频对抗攻击方法,该方法可以在几分钟内生成低扰动和高鲁棒性的音频样

本。LI 等人

[13]

提出了对抗音乐的方法,并成功地欺骗了 Amazon Alexa 唤醒词检

测系统。

1.3 威胁模型

可以针对音频领域中自动语音识别任务进行有目标的音频对抗攻击。给定

一个音频输入 x,目标是生成一个听起来类似于 x 的新音频 x'=x+δ,但是 f(x')=t。

仅当目标模型预测的短语与攻击者选择的目标短语完全匹配时,攻击才会成功。

选择攻击 DeepSpeech 模型,这是由 Mozilla 使用 TensorFlow 实现的开源语音

文本引擎。该模型使用 Mel 频率倒谱(MFC)转换作为输入的预处理,然后是递归

神经网络(RNN)使用 LSTM

[14]

将音频波形映射到单个字符上的概率分布序列。

与大多数以前的工作中使用的威胁模型一样,笔者假设白盒攻击设置,其中攻击

者可以完全访问模型,并且知道模型的所有参数和体系结构。此威胁模型用于

评估最坏情况下的系统安全性。

2 方法

剩余10页未读，继续阅读

评论收藏

内容反馈

版权申诉

针对ASR系统的快速有目标自适应对抗攻击.docx

评论0

最新资源

针对ASR系统的快速有目标自适应对抗攻击.docx

评论0

最新资源

相关推荐

自适应编码调制.docx

基于深度强化学习的码率自适应算法研究.docx

基于MATLAB自适应均衡器.docx

带有修正项的非线性系统自适应学习控制.docx

影像三维重建的网格自适应快速优化.docx

具有未建模动态的互联大系统事件触发自适应模糊控制.docx

海面背景耀光的自适应抑制系统.docx

卷积神经网络中的自适应加权池化.docx

远程监督的自适应实体抽取.docx

HTML中使背景图片自适应浏览器大小.docx

基于重点域的自适应加点方法.docx

虚拟网络功能资源容量自适应调整方法.docx

面向高反光区域的自适应结构光.docx

面向灾害应急服务的自适应制图技术.docx

点云内在属性因子驱动的自适应滚球算法.docx

最大互相关熵多凸组合自适应滤波算法.docx

单目结构光测量中参数自适应标定方法.docx

深入剖析蓝牙可靠性的自适应跳频原理.docx

一种适用于QAM-OFDM自适应分配算法.docx

相关实用应用程序（Windows可用）

李飞飞自传 我看见的世界 The World I see

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

第十九届研电赛-技术论文模板

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

智联招聘：2024年大学生就业力调研报告.pdf

4个亲测好用的ChatGPT4渠道

2024年俄罗斯商用车数字集群信息娱乐系统市场机会及渠道调研报告Sample.pdf

李飞飞自传我看见的世界 The World I see