【免费】2021-分布式深度学习隐私与安全攻击研究进展与挑战1资源-CSDN文库

需积分: 0 195 浏览量 2022-08-03 20:20:29 上传评论收藏 2.88MB PDF 举报

资源详情

资源评论

资源推荐

计算机研究与发展

DOI

１０．７５４４∕issn１０００Ｇ１２３９．２０２１．２０２００９６６

JournalofCom

uterResearchandDevelo

ment ５８

(

５

９２７９４３

２０２１

收稿日期

２０２０

－

１１

－

２５

;

修回日期

２０２１

－

０２

－

０９

基金项目

国家自然科学基金项目

(

６２０７２２３９

６２００２１６７

);

广西可信软件重点实验室研究课题

(

KX２０２０２９

);

中央高校基本科研业务费专项资

金

(

３０９２００２１１２９

)

Thiswork wassu

orted b

the NationalNaturalScience Foundation ofChina

(

６２０７２２３９

６２００２１６７

the Guan

xiKe

Laborator

ofTrustedSoftware

(

KX２０２０２９

andtheFundamentalResearchFundsfortheCentralUniversities

(

３０９２００２１１２９

)

．

通信作者

付安民

(

fuam＠n

ust．edu．cn

)

分布式深度学习隐私与安全攻击研究进展与挑战

周纯毅

１

２

陈大卫

１

王

尚

１

付安民

１

２

高艳松

１

(

南京理工大学计算机科学与工程学院

南京

　２１００９４

)

２

(

桂林电子科技大学广西可信软件重点实验室

广西桂林

　５４１００４

)

(

zhouchun

i＠n

ust．edu．cn

)

ResearchandChallen

eofDistributedDee

Learnin

Privac

andSecurit

Attack

ZhouChun

１

２

ChenDawei

１

Wan

Shan

１

FuAnmin

１

２

andGaoYanson

１

(

Schoolo

Com

uterScienceandEn

ineerin

Nan

Universit

Science

Technolo

Nan

２１００９４

)

２

(

Guan

xiKe

Laborator

TrustedSo

tware

GuilinUniversit

ElectronicTechnolo

Guilin

Guan

５４１００４

)

Abstract　Differentfromthecentralizeddee

learnin

mode

distributeddee

learnin

etsridofthe

limitationthatthedatamustbecentralizeddurin

themodeltrainin

rocess

whichrealizesthelocal

eration ofthe data

and allows all

artici

ants to collaborate without exchan

data．It

nificantl

reducestheriskofuser

rivac

leaka

breaksthedataislandfromthetechnicallevel

andim

rovestheefficienc

ofdee

learnin

．Distributeddee

learnin

canbewidel

usedinsmart

medicalcare

smartfinance

smartretailandsmarttrans

ortation．However

icalattackssuchas

enerativeadversarialnetworkattacks

membershi

inferenceattacksandbackdoorattacks

have

revealedthatdistributeddee

learnin

stillhasserious

rivac

vulnerabilitiesandsecurit

threats．

This

erfirstcom

aresandanal

zesthecharacteristicsofthethreedistributeddee

learnin

modes

andtheircore

roblems

includin

collaborativelearnin

federatedlearnin

ands

litlearnin

．

Secondl

from the

ers

ectiveof

rivac

attacks

itcom

rehensivel

oundsvarioust

esof

rivac

attacksfacedb

distributeddee

learnin

andsummarizestheexistin

rivac

attackdefense

methods．Atthesametime

fromthe

ers

ectiveofsecurit

attacks

the

eranal

zestheattack

rocessandinherentsecurit

threatsofthethreesecurit

attacks

data

oisonin

attacks

adversarial

sam

leattacks

andbackdoorattacks

andanal

zestheexistin

securit

attackdefensetechnolo

fromthe

ers

ectivesofdefense

rinci

les

adversar

abilities

anddefenseeffects．Finall

from

the

ers

ectiveof

rivac

andsecurit

attacks

thefutureresearchdirectionsofdistributeddee

learnin

arediscussedand

ros

ected．

words　dee

learnin

;

distributeddee

learnin

;

rivac

attack

;

rivac

rotection

;

backdoor

attack

摘

要

不同于集中式深度学习模式

分布式深度学习摆脱了模型训练过程中数据必须中心化的限制

实现了数据的本地操作

允许各方参与者在不交换数据的情况下进行协作

显著降低了用户隐私泄露风

险

从技术层面可以打破数据孤岛

显著提升深度学习的效果

能够广泛应用于智慧医疗

、

智慧金融

、

智慧零售和智慧交通等领域

．

但生成对抗式网络攻击

、

成员推理攻击和后门攻击等典型攻击揭露了分布

式深度学习依然存在严重隐私漏洞和安全威胁

．

首先对比分析了联合学习

、

联邦学习和分割学习

３

种主

流的分布式深度学习模式特征及其存在的核心问题

．

其次

从隐私攻击角度

全面阐述了分布式深度学

习所面临的各类隐私攻击

并归纳和分析了现有隐私攻击防御手段

．

同时

从安全攻击角度

深入剖析了

数据投毒攻击

、

对抗样本攻击和后门攻击

３

种安全攻击方法的攻击过程和内在安全威胁

并从敌手能

力

、

防御原理和防御效果等方面对现有安全攻击防御技术进行了度量

．

最后

从隐私与安全攻击角度

对

分布式深度学习未来的研究方向进行了讨论和展望

．

关键词

深度学习

;

分布式深度学习

;

隐私攻击

;

隐私保护

;

后门攻击

中图法分类号

　TP３９１

近年来全球掀起人工智能研发浪潮

美国

、

日

本

、

英国

、

德国等世界科技强国纷纷将人工智能上升

为国家战略

力图在新一轮国际科技竞争中掌握主

导权

．２０１７

年我国发布了

新一代人工智能发展规

划

»,

明确提出要抢抓人工智能发展的重大战略机

遇

构筑我国人工智能发展的先发优势

加快建设创

新型国家

．

深度学习作为实现人工智能的一种重要

方法

通过海量训练数据构建具有很多隐层的深度

学习模型

获得强大的数据特征学习能力

．

在深度学

习过程中

普遍认为训练数据量越大

训练得到的模

型的鲁棒性和准确性越高

[

１

]

．

因此

深度学习通常需

要着重考虑数据的多源性

即通过汇聚各个机构或

者用户数据完成整体计算任务

以提高训练模型的

准确性

．

但在深度学习模型训练过程中

运营商可能

会窃取用户的隐私信息

．

同时

公司之间的数据共享

需要用户的授权

而许多用户出于隐私泄露的顾虑

而拒绝数据共享

．

这些因素会导致

“

数据孤岛

”,

难以

创造出

“

１＋１＞２

”

的数据价值

[

２

]

．

因此

随着各国法

律法规对于隐私信息使用的严格限制和公众隐私保

护意识的加强

如何在保护数据隐私的前提下实现

行业协作与协同治理

如何破解数据隐私保护与数

据孤岛的两难困境

成为当下深度学习应用中亟待

解决的技术难题

．

不同于传统的集中式深度学习

分布式深度学

习通过将深度学习与协作性模型相结合

使各个机

构或者用户在不交换数据的情况下进行协作训练并

获得更加精准的深度学习模型

[

３

]

以便在满足隐私

保护和数据安全的前提下实现数据的有效利用

[

４

]

．

分布式深度学习模型将模型训练过程从云端转移至

用户端

允许各方参与者在不暴露数据的情况下完

成训练

降低了用户隐私泄露风险

[

５Ｇ６

]

和通信开

销

[

７

]

从技术层面可以打破数据孤岛

明显提高深度

学习的性能

能够实现多个领域的落地应用

比如智

慧医疗

、

智慧金融

、

智慧零售和智慧交通等

[

８

]

．

分布

式深度学习作为大数据使用的新范式

是破解数据

隐私保护与数据孤岛难题的新思路

一经提出就成

为国际学术界和产业界关注的焦点

．

图

１

展示了集

中式深度学习和分布式深度学习训练模式的区别

．

．１　Centralizeddee

learnin

anddistributeddee

learnin

图

１　

集中式深度学习与分布式深度学习

海量的用户数据

、

丰富的应用场景促进了分布式

深度学习技术的蓬勃发展

但生成对抗式网络攻击

、

成员推理攻击和属性推理攻击等隐私攻击揭露了分

布式深度学习依然存在严重隐私漏洞

[

５

]

．

在

２０１７

年

８２９

计算机研究与发展

　２０２１

５８

(

５

)

的计算机和通信安全

(

ACM ConferenceonCom

uter

andCommunicationsSecurit

)

会议上

Hita

等人

[

９

]

设计了一种基于生成式对抗网络攻击的新型隐私攻

击方式

．

攻击者伪装成正常用户加入模型训练后

可

以基于生成式对抗网络的方法获得其他参与训练者

的数据仿真集

极大地威胁到用户的数据安全

．

同

时

Shokri

等人

[

１０

]

提出了一种称为成员推理攻击的

隐私攻击方法

．

攻击者通过训练多个影子分类器为

攻击模型提供训练集

训练好的攻击模型可以输出

某条记录是否在目标训练集中

．

最近

文献

[

１１

]

又提

出了一种属性推理攻击

可以在攻击者仅拥有训练

集子集的情况下获取用户数据集的各类属性信息

如性别分布

、

年龄分布

、

收入分布等

．

可见

在分布式

深度学习模式下

攻击者依然可以通过生成式对抗

网络攻击等一系列典型隐私攻击方式获取用户的隐

私数据信息

．

另一方面

在现有的分布式深度学习框

架中

参与者在本地训练模型并向云服务器共享明

文梯度

．

由于无法监管参与者在本地的训练行为

使

得分布式学习容易遭受数据投毒

、

对抗样本和后门

攻击的威胁

．

怀有恶意的参与者

在训练过程中可以

利用数据投毒攻击

有目的性地更改本地数据的标

签

上传

“

有毒

”

的梯度

,“

污染

”

协作训练的模型

使

得模型预测结果准确率下降

．

此外攻击者可以上传

后门本地模型

替换全局模型

以便模型有更高的概

率输出攻击者的目标标签

[

１２

]

．

综上所述

分布式深度学习是破解数据隐私保

护与数据孤岛难题的新思路

[

１３

]

但其依然面临严重

隐私漏洞和安全威胁

．

本文系统研究和分析了分布

式深度学习面临的隐私与安全攻击问题

主要包含

４

个方面内容

１

)

对比分析了联合学习

、

联邦学习和分割学习

３

种主流的分布式深度学习模式

归纳总结了它们

各自特征及其存在的核心问题

;

２

)

从隐私攻击角度

全面阐述了分布式深度学

习所面临的各类隐私攻击

并归纳和分析了差分隐

私

、

同态加密和安全多方计算等隐私攻击防御手段

;

３

)

从安全攻击角度

深入剖析了数据投毒攻

击

、

对抗样本攻击和后门攻击

３

种安全攻击方法的

攻击过程和内在安全威胁

并从数据集

、

模型输入和

模型训练角度对现有的安全防御技术进行了归纳与

总结

;

４

)

针对现有的隐私和安全攻击与防护研究中

存在的主要问题

讨论和指出了分布式深度学习领

域下一步可能的研究方向

．

１　

分布式深度学习概述

分布式深度学习无需用户上传本地数据就可以

协作完成模型训练

消除了用户关于数据云端存储

不可控的担忧

缓解了传统集中式深度学习收集用

户数据所带来的隐私泄露问题

．

从训练模式上来看

分布式深度学习目前主要有联合学习

、

联邦学习和

分割学习

３

种

．

１．１　

联合学习

联合学习首次由

Shokri

等人

[

１４

]

于

２０１５

年提

出

它打破了集中式深度学习的固有模式

．

如图

２

所

示

在这种训练模式下

云服务器首先收集一批用户

的数据集训练初始的全局模型

然后参与联合学习

的第

１

个用户下载初始模型并基于自己的数据集使

用随机梯度下降法

(

stochastic

radientdescent

SGD

)

在本地训练模型

．

训练结束后

该用户按照一

定比例随机选择部分模型参数上传到云服务器完成

全局模型的更新

．

当第

１

个用户上传完毕后

下一个

用户下载新的全局模型

并重复上述的训练和上传

操作

这个过程将持续到模型收敛或达到预先设定

的迭代次数

．

．２　Trainin

modeofcollaborativelearnin

图

２　

联合学习训练模式

然而

由于联合学习的训练流程是每个用户异

步进行的

因此当网络拥塞或用户离线时会导致全

局参数无法顺利更新

其余用户会进入等待状态

训

练效率可能会受到严重的影响

．

１．２　

联邦学习

[

１５

]

在

２０１７

年由

Goo

提出

它改进

９２９

周纯毅等

分布式深度学习隐私与安全攻击研究进展与挑战

剩余16页未读，继续阅读

评论收藏

内容反馈

张匡龙

粉丝: 17
资源: 279

2021-分布式深度学习隐私与安全攻击研究进展与挑战1

评论0

最新资源

2021-分布式深度学习隐私与安全攻击研究进展与挑战1

评论0

分布式深度学习隐私与安全攻击研究进展与挑战.pdf

分布式深度学习隐私与安全攻击研究进展与挑战.docx

机器学习安全攻击与防御机制研究进展和未来挑战1

机器学习安全攻击与防御机制研究进展和未来挑战.pdf

直角转弯机step和stp格式-零件图-机械工程图-机械三维3D建模图打包下载.zip

2021-07-28-.NET 6 秒杀项目---分布式锁落地实战.zip

2021-07-28-.NET 6 秒杀项目---分布式锁落地实战.rar

应用服务平台-分布式微服务应用平台建设方案.pdf

人工智能-机器学习-分布式学习系统软件建模方法研究.pdf

大数据-算法-分布式数据库安全框架研究.pdf

研究论文-分布式多机器人协作研究与仿真.pdf

金民一期婚姻管理测试系统_开发框架功能点-分布式缓存.pdf

网络游戏-分布式深度神经网络集群分组同步优化方法及系统.zip

paxos-分布式一致性协议.pdf

Q-GDW-1972-2013-分布式光伏并网专用低压断路器技术规范

ActiveMQ实例---分布式发送邮件

论文研究-分布式环境下保持隐私的聚类挖掘算法.pdf

人工智能-深度学习-分布式控制系统中新安全保障技术的研究安全核技术.pdf

57-分布式事务的总结与思考1

ZooKeeper-分布式过程协同技术详解

最新版ISO/IEC 27001:2022、ISO 27002:2022中英文合集

Goby红队版-win-x64-2.4.7版本

Chrome Header Editor 插件

ISO SAE 21434-2021 中文版.pdf

安全认证cisp教材全套

OpenVAS GVM 中文翻译补丁

2024最新：Hvv中常见的面试问题

最新资源