面向用户的支持用户掉线的联邦学习数据隐私保护方法.docx资源-CSDN文库

版权申诉

文档资料

58 浏览量 2022-06-17 16:21:15 上传评论收藏 302KB DOCX 举报

资源推荐

资源详情

资源评论

0 引言

随着机器学习理论技术的不断成熟机器学习的隐私保护也面临着巨大挑战。

例如欧洲联盟更新的《通用数据保护条例》







将数据收集和存储限制在消费者

同意且绝对必要的处理范围内。这导致“数据孤岛”现象出现 企业拥有数据却无

法有效利用。对此 年谷歌提出了联邦学习







对“数据孤岛”现象给出了新的

解决思路。联邦学习是一种效率较高的分布式协同学习方案 企业可以通过联邦

学习基于本地隐私数据训练出更加准确的全局模型。训练过程中用户以独立且

同步的方式在本地训练好模型然后将模型参数发送给服务器服务器收集并聚合

所有用户的模型参数发送给用户如此迭代训练。联邦学习使得用户的隐私数据

不需要离开本地就能训练出一个更加准确的全局模型这不仅保护了训练数据也

实现了企业之间的互联互通。

联邦学习在信用卡欺诈检测







、通信诈骗识别







等多个领域都有应用。虽然

联邦学习能够为用户提供共享模型但是在训练过程中可能侵犯用户隐私。有研

究表明与服务器相互通信的模型信息、训练之后模型公开的  查询等会导致

用户信息泄露。文献



提出的黑盒推理攻击攻击者利用模拟数据构建多个目标

模型的影子模型并基于影子模型和目标模型的输出结果训练出一个可判断是否

为目标模型训练数据的攻击模型。文献



通过观察目标模型预测结果重建了模

型训练时使用的人脸图像数据。为了抵御这类攻击文献



发现了高度可逆模型

该模型可通过增加少量噪声变得不可逆。

针对联邦学习面临的黑盒推理攻击研究领域大多采用差分隐私







的方式进行

防御使攻击者不能以高置信度推断出训练数据的特定信息。目前的研究领域主

要包含两方面）添加噪声的工作由服务器完成。）添加噪声的工作由用户完

成。

在服务器添加噪声的研究中文献



提出了在分布式设置中的差分隐私机器

学习方法。该方法安全聚合本地模型并使用拉普拉斯噪声







来实现差分隐私但

是噪声比例与用户最小数据成反比。文献



从用户的角度提出了差分隐私联邦

优化方法在服务器的聚合参数上添加噪声在聚合的过程中隐藏了单个用户的贡

献。服务器添加噪声虽然可以实现参数扰动但在实际应用中服务器无法直接在

模型参数上添加噪声其收到的模型参数往往是经过同态加密或者安全多方计算

处理之后的







。

在用户添加噪声的研究中文献



提出在用户训练的模型参数上添加高斯

噪声但该方法没有考虑到全局隐私损失。文献



提出一种在用户模型参数上

依据概率添加噪声的方法但该方法将模型参数假定在一定范围内不能适用所有

的训练数据。用户添加噪声虽然可以实现噪声扰动但是不能控制隐私损失且目

前用户噪声添加方法没有处理用户掉线问题。如果用户因为网络故障等原因无

法上传模型参数则联邦学习迭代过程中添加的扰动不能严格满足差分隐私要求。

本文提出一种面向用户的支持用户掉线的联邦学习隐私保护方法 来有效抵

御黑盒推理攻击。实验结果表明本文所提方法能够在模型隐私性和可用性之间

达到一个平衡并且能够解决用户掉线问题适用于参数保护下的联邦学习系统。

 ） S 聚合所有用户上传的 Δwj 得到模型参数更新值的聚合结果 w

′=∑j=1mΔwj"#$。

）S 将 w′"返回给用户用户计算均值更新本地模型。

）重复迭代过程直至模型收敛。

差分隐私

差分隐私（%%&&'()*+）是通过添加噪声来掩盖相邻数据之间

查询的差异性。差分隐私查询可确保在数据中增加或删除一条数据时查询结果

保持不变攻击者无法根据查询结果推断出用户隐私并且无须关心攻击者拥有的

背景知识。即使攻击者知道除一条记录信息之外的所有记录信息也无法推测出

这条记录的敏感信息。

定义 1,(ε,δ) -.!/差分隐私







给定一个隐私算法 M对于至多相差  条记录的

相邻数据 D 和 D′" 如果 M 在这两个数据上的输出结果

S(S⊆range(M))0 0⊆1& 2!! 满足 Pr[M(D)∈2 !∈,

S]≤eε×Pr[M(D′)∈S]+δ03&-42 "!∈05.则称 M 满足 (ε,δ) -.!/ 差分

隐私。其中Pr[⋅]⋅表示 M 暴露隐私信息的概率参数 ε- 为隐私预算代表隐私

保护的程度。一般来说ε- 值越小D 和 D′"输出的概率分布越接近隐私保护

级别越高。当 ε=0- 时M2 针对 D 和 D′"的输出概率完全相同。然而 ε-

的取值是一个开放性的问题有些情况下更大的 ε- 值可以提供更有意义的隐私

保证。参数 δ. 是一个松弛项例如当 δ=e−5.&6 时表示只能容忍 e−5&6

的概率违反严格差分隐私。当 δ=0. 时满足 ε--/差分隐私简称 ε-DP-/。

应用差分隐私进行处理的数据主要分为两类。一类是数值型的数据 另一类

是非数值型的数据。对于数值型的数据一般采用拉普拉斯机制







或者高斯机制







对于非数值型的数据一般采用指数机制







。本文对模型参数添加差分隐私扰

动主要针对的是数值型数据。拉普拉斯机制可满足 ε−DP-6故本文采用带

有一个松弛项的高斯机制。噪声大小取决于算法的敏感度







。

剩余16页未读，继续阅读

评论收藏

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3655
资源: 1万+

面向用户的支持用户掉线的联邦学习数据隐私保护方法.docx

支持数据隐私保护的联邦深度神经网络模型研究.docx

支持多数不规则用户的隐私保护联邦学习框架.docx

基于数据属性修改的联邦学习隐私保护策略.docx

ChatGPT模型的联邦学习与隐私保护方法研究.docx

基于区块链和联邦学习的边缘计算隐私保护方法.docx

数据结构模拟试卷.docx

一种大数据环境下的数据质量监控方法.docx

大数据时代的用户数据隐私保护培训资料.docx

一种使用区块链保护车联网数据隐私的方法.docx

支持数据隐私保护的恶意加密流量检测确认方法.docx

基于深度学习的位置大数据统计发布与隐私保护方法.docx

区块链数据隐私保护研究.docx

企业数据安全与隐私保护.docx

区块链交易数据隐私保护机制.docx

机器学习与数据挖掘复习..docx

基于Hive的淘宝用户行为数据分析.docx

面向视频监控基于联邦学习的智能边缘计算技术.docx

7-数据营销推广.docx

竞价推广之最全的5种数据分析方法!.docx

支持区间查询的基于位置服务外包数据隐私保护方案.docx

全国计算机等级考试二级Python真题及解析.docx

1000份ppt模版，PPT模板优秀PPT

导入证书可以解决”无法建立到信任根颁发机构的证书链"问题。

matlab批量读取excel表格数据并处理画图

OpenCv车辆识别训练模型

代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf

数学建模对乙醇偶合制备C4烯烃的问题研究

Vue-Element UI集成ECharts实现数据统计分析页代码部分(如果帮助到你，感谢关注点赞)

最新资源