img
share 分享

scikit-learn机器学习:常用算法原理及编程实战

作者:黄永昌

出版社:机械工业出版社

ISBN:9787111590248

VIP会员免费 (仅需0.8元/天) ¥ 25.0

温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!

电子书推荐

更多资源 展开

隐私保护数据发布:模型与算法.吴英杰(带详细书签).pdf 评分:

本书主要阐述数据共享发布中的两大主要隐私保护模型及其关键算法。 全书分为两篇,第一篇阐述匿名隐私保护数据发布,由第1~9章组成,主要内容涉及匿名隐私保护相关知识、k匿名组规模的上界讨论、关系型数据发布及其扩展背景(数据增量更新和多敏感属性数据发布)下的匿名隐私保护、非关系型数据(包括事务型数据、社会网络数据和轨迹数据)发布中的匿名隐私保护模型及算法、面向LBS应用的位置隐私保护等;第二篇阐述差分隐私保护数据发布,由第10~19章组成,主要内容涉及差分隐私基础知识、基于k叉平均树的差分隐私数据发布、面向任意区间树结构及其扩展背景(考虑区间查询分布和异方差加噪)下的差分隐私直方图发布、面向其他应用背景(流/连续数据发布、稀疏/多维数据发布)的差分隐私保护、差分隐私下的频繁模式挖掘等。 本书主要面向计算机科学、网络空间安全、管理科学与工程等相关学科专业高年级本科生、研究生以及广大研究数据安全隐私保护的科技工作者。 第一篇 基于匿名模型的隐私保护数据发布 1 第1章 绪论 3 1.1 隐私保护数据发布 3 1.2 匿名隐私保护模型 4 1.2.1 k-匿名模型 4 1.2.2 l-多样性模型 5 1.2.3 t-Closeness 6 1.3 数据质量度量 6 1.4 匿名隐私保护的主要研究方向 7 1.5 隐私保护数据发布研究展望 8 参考文献 8 第2章 k-匿名组规模的上界讨论 10 2.1 引言 10 2.2 现有算法的k-匿名组规模上界 10 2.3 基于取整划分函数的k-匿名算法 11 2.3.1 均衡二划分存在的问题 12 2.3.2 基于取整划分函数的划分策略 13 2.3.3 基于取整划分函数的k-匿名算法的匿名组规模上界 14 2.3.4 基于取整划分函数的k-匿名算法(划分部分)时间复杂度分析 16 2.4 实验结果与分析 17 2.5 本章小结 18 参考文献 18 第3章 基于空间划分的隐私保护关系型数据发布算法 20 3.1 引言 20 3.2 基于动态规划的最优k-匿名严格划分算法 22 3.2.1 相关工作 22 3.2.2 基于子空间多维划分的最优k-匿名问题 23 3.2.3 基于子空间划分的最优k-匿名动态规划算法 26 3.2.4 实验结果与分析 29 3.3 基于动态规划的最优严格划分数据发布算法 36 3.3.1 算法框架 37 3.3.2 实验结果与分析 38 3.4 基于混合划分技术的数据发布算法 41 3.4.1 严格划分的数据可以在信息损失上进一步改进 41 3.4.2 非严格划分的数据可能在可用性上不如严格划分数据 42 3.4.3 混合划分技术及算法 44 3.4.4 实验结果与分析 45 3.5 本章小结 48 参考文献 48 第4章 隐私保护增量数据重发布 50 4.1 引言 50 4.1.1 问题实例 50 4.1.2 已有研究与不足 52 4.2 问题与相关知识 53 4.2.1 问题描述 53 4.2.2 多维划分 53 4.2.3 数据质量度量 54 4.3 增量更新数据的发布 54 4.3.1 增量更新数据的概化 54 4.3.2 单调概化原则 56 4.4 增量更新k-匿名算法 57 4.4.1 算法描述 57 4.4.2 算法的运行实例 58 4.4.3 算法讨论 58 4.5 实验分析 59 4.5.1 隐私泄露比较 59 4.5.2 数据质量比较 60 4.5.3 执行时间比较 61 4.6 本章小结 62 参考文献 62 第5章 面向多敏感属性的隐私保护数据发布 64 5.1 引言 64 5.2 基础知识与问题描述 65 5.2.1 基本定义 65 5.2.2 问题描述 65 5.3 p-覆盖k-匿名模型 66 5.4 面向多敏感属性保护的p-覆盖k-匿名算法 67 5.4.1 相关性质 67 5.4.2 算法描述 68 5.4.3 算法实例 69 5.5 实验结果与分析 69 5.5.1 敏感属性泄露比较 70 5.5.2 数据质量比较 70 5.5.3 运行时间比较 70 5.6 本章小结 73 参考文献 74 第6章 隐私保护事务型数据发布 75 6.1 引言 75 6.2 基于剖分的隐私保护事务型数据发布 75 6.3 事务型数据发布的p-剖分l-多样化算法 78 6.3.1 属性剖分 78 6.3.2 记录划分 78 6.3.3 算法时间复杂度分析 79 6.4 实验结果与分析 79 6.4.1 关联规则数量测试 80 6.4.2 关联规则挖掘正确率测试 80 6.5 本章小结 82 参考文献 82 第7章 隐私保护社会网络数据发布 84 7.1 引言 84 7.2 基础知识与相关隐私保护技术 85 7.2.1 社会网络的定义和数学表示 85 7.2.2 社会网络数据的特点 86 7.2.3 社会网络中的隐私模型 86 7.2.4 攻击者的背景知识 86 7.2.5 匿名后的数据可用性 86 7.2.6 社会网络数据匿名技术 87 7.3 面向度数攻击的隐私保护社会网络数据发布 88 7.3.1 问题提出 88 7.3.2 相关工作 88 7.3.3 度数攻击模型 89 7.3.4 防止度数攻击的社会网络匿名算法 89 7.3.5 实验数据与分析 91 7.4 面向子图攻击的隐私保护社会网络数据发布 96 7.4.1 问题提出 96 7.4.2 相关工作 97 7.4.3 (d,k)-匿名社会网络模型 97 7.4.4 防止子图攻击的社会网络匿名算法 98 7.4.5 实验结果与分析 101 7.5 本章小结 106 参考文献 106 第8章 隐私保护轨迹数据发布 108 8.1 引言 108 8.2 基础知识与相关隐私保护技术 108 8.2.1 相关定义 108 8.2.2 基于聚类的轨迹数据隐私保护技术 109 8.3 基于聚类杂交的隐私保护轨迹数据发布算法 111 8.3.1 相关工作 111 8.3.2 二次聚类攻击 111 8.3.3 基于聚类杂交的轨迹数据发布算法 117 8.3.4 实验结果与分析 118 8.4 隐私保护轨迹数据发布的l-多样化算法 128 8.4.1 问题提出 128 8.4.2 轨迹l-多样化隐私保护算法 129 8.4.3 实验结果与分析 132 8.5 个性化隐私保护轨迹数据发布 137 8.5.1 问题提出 137 8.5.2 问题描述 137 8.5.3 个性化轨迹发布隐私保护算法 138 8.5.4 实验结果与分析 140 8.6 基于网格划分的轨迹分段匿名隐私保护算法 145 8.6.1 问题提出 145 8.6.2 基于空间网格划分的不规则分段轨迹隐私保护算法 145 8.6.3 防止重叠攻击的轨迹分段匿名算法 147 8.6.4 实验结果与分析 148 8.7 本章小结 152 参考文献 152 第9章 面向LBS应用的位置隐私保护 154 9.1 引言 154 9.2 基础知识与相关位置隐私保护技术 155 9.2.1 系统结构 155 9.2.2 位置隐私保护技术 157 9.3 欧氏空间下面向连续查询的位置隐私保护 158 9.3.1 问题提出 158 9.3.2 相关定义与问题性质 159 9.3.3 基于历史轨迹的连续查询隐私保护算法 161 9.3.4 实验结果与分析 162 9.4 公路网络下防止边权分布攻击的位置隐私保护 165 9.4.1 问题提出 165 9.4.2 基础知识与相关定义 166 9.4.3 防止边权分布攻击的位置隐私保护算法 167 9.4.4 实验结果与分析 169 9.5 欧氏空间下的交互式位置隐私保护 173 9.5.1 问题提出 173 9.5.2 交互式模型与协议 173 9.5.3 交互式位置隐私保护算法 176 9.5.4 防止速度关联攻击的交互式位置隐私保护算法 182 9.6 本章小结 189 参考文献 189 第二篇 基于差分隐私的隐私保护数据发布 193 第10章 基于差分隐私的统计数据发布概述 195 10.1 ε-差分隐私模型 195 10.2 差分隐私的实现机制 196 10.2.1 Laplace机制 197 10.2.2 指数机制 198 10.3 差分隐私的组合特性 198 10.4 差分隐私数据保护框架 198 10.5 差分隐私保护方法的性能度量 199 参考文献 200 第11章 基于k叉平均树的差分隐私数据发布 202 11.1 引言 202 11.2 问题与相关性质 203 11.2.1 问题提出 203 11.2.2 相关性质 204 11.3 基于k叉平均树的差分隐私直方图发布算法 204 11.3.1 算法思想及描述 204 11.3.2 算法分析 206 11.3.3 与同类算法的噪声比较 208 11.3.4 实验结果与分析 209 11.4 面向多维组合查询的差分隐私直方图发布算法 212 11.4.1 多维组合查询问题 212 11.4.2 算法思想及描述 213 11.4.3 算法分析 215 11.4.4 实验结果与分析 215 11.5 本章小结 219 参考文献 219 第12章 面向任意区间树结构的差分隐私直方图发布 220 12.1 引言 220 12.2 基础知识与问题提出 221 12.2.1 基础知识 221 12.2.2 问题提出 222 12.3 面向任意区间树结构的差分隐私直方图发布迭代算法 222 12.3.1 k-区间树 222 12.3.2 局部最优线性无偏估计及其算法 224 12.3.3 基于LBLUE解全局最优线性无偏估计的迭代算法 225 12.3.4 算法分析 226 12.3.5 实验结果与分析 230 12.4 面向任意区间树结构的差分隐私直方图发布线性时间算法 235 12.4.1 差分隐私区间树中节点权值的最优线性无偏估计 235 12.4.2 求解差分隐私区间树节点权值最优线性无偏估计的算法 236 12.4.3 算法复杂度分析 238 12.4.4 实验结果与分析 238 12.5 本章小结 242 参考文献 242 第13章 基于树重构的差分隐私直方图发布 243 13.1 引言 243 13.2 基于区间查询概率的差分隐私直方图发布 243 13.2.1 问题提出 243 13.2.2 基于区间计数查询概率的差分隐私直方图发布算法 246 13.2.3 实验结果与分析 250 13.3 基于哈尔小波有损压缩的直方图发布 253 13.3.1 哈尔小波变换 254 13.3.2 问题提出 257 13.3.3 基于哈尔小波零树压缩的直方图发布算法EHWT-DP 258 13.3.4 实验结果与分析 262 13.4 本章小结 269 参考文献 269 第14章 异方差加噪下的差分隐私直方图发布 270 14.1 引言 270 14.2 基础知识与问题 270 14.3 异方差加噪下面向任意树结构的差分隐私直方图发布算法 271 14.3.1 节点覆盖概率计算 272 14.3.2 节点系数计算及隐私预算分配 272 14.3.3 算法描述与分析 276 14.4 实验结果与分析 280 14.4.1 查询精度比较 281 14.4.2 算法运行效率比较 284 14.5 本章小结 285 参考文献 285 第15章 差分隐私连续数据发布 287 15.1 引言 287 15.2 相关工作与基础知识 288 15.2.1 相关工作 288 15.2.2 矩阵机制 289 15.3 基于矩阵机制的差分隐私连续数据发布 289 15.4 隐私连续数据发布算法 290 15.4.1 策略矩阵的构建 290 15.4.2 查询均方误差的降低 293 15.4.3 最小误差的快速求解 294 15.4.4 优化效果分析 298 15.5 实验结果与分析 299 15.5.1 与朴素方法的对比实验结果与分析 300 15.5.2 与基于二叉树方法的对比实验结果与分析 300 15.5.3 与静态数据发布方法的对比实验结果与分析 301 15.6 本章小结 302 参考文献 302 第16章 面向二维数据流的差分隐私统计发布 305 16.1 引言 305 16.2 基础知识与相关定义 306 16.3 固定长度二维数据流的差分隐私统计发布 306 16.3.1 问题描述 306 16.3.2 算法思想与描述 307 16.3.3 算法空间复杂度分析 311 16.4 任意长度二维数据流的差分隐私连续统计发布 311 16.4.1 算法思想与描述 311 16.4.2 算法分析 312 16.5 实验结果与分析 312 16.5.1 差分隐私统计发布固定长度二维数据流的可用性 312 16.5.2 差分隐私统计发布任意长度二维数据流的可用性 313 16.6 本章小结 314 参考文献 314 第17章 差分隐私二维空间数据划分发布 316 17.1 引言 316 17.2 基础知识与相关定义 316 17.3 基于kd-树的差分隐私二维空间数据划分发布算法 318 17.3.1 问题提出 318 17.3.2 算法思想与描述 318 17.3.3 实验结果与分析 320 17.4 基于四分树的差分隐私二维空间数据划分发布算法 324 17.4.1 问题提出 324 17.4.2 算法思想与描述 325 17.4.3 实验结果与分析 328 17.5 本章小结 332 参考文献 332 第18章 面向低频统计值的差分隐私数据发布 334 18.1 引言 334 18.2 面向低频计数值的差分隐私直方图发布 334 18.2.1 问题提出 334 18.2.2 算法思想与描述 335 18.2.3 算法分析及优化 336 18.2.4 算法运行实例 337 18.2.5 实验结果与分析 338 18.3 差分隐私稀疏列联表发布 340 18.3.1 问题提出 340 18.3.2 算法思想与描述 342 18.3.3 实验结果与分析 346 18.4 本章小结 354 参考文献 354 第19章 差分隐私下的频繁模式挖掘 355 19.1 引言 355 19.2 基础知识与问题 355 19.3 差分隐私下的频繁模式挖掘问题分析 357 19.3.1 全局敏感度分析 357 19.3.2 误差分析 357 19.3.3 单调性分析 358 19.4 基于事务截断的差分隐私频繁模式挖掘 358 19.4.1 基于指数机制的事务截断方法 359 19.4.2 基于最小噪声支持度的差分隐私频繁模式挖掘 360 19.4.3 频繁模式挖掘结果集的单调性调节 361 19.5 实验结果与分析 363 19.5.1 全局敏感度比较 365 19.5.2 数据可用性比较 366 19.5.3 引入最小噪声支持度的实验分析 367 19.5.4 频繁模式挖掘结果集的单调性实验分析 368 19.6 本章小结 371 参考文献 371

...展开详情
上传时间:2019-03 大小:104.75MB
热门图书