没有合适的资源?快使用搜索试试~ 我知道了~
大数据是经济发展的新动能, 社会发展的新引擎, 塑造国家竞争力的战略制高点, 对人民生活 具有重大影响. 然而随着社会对数据价值认知的提升和大数据平台建设的蓬勃发展, 大数据安全问题 日益成为阻碍大数据应用推广的瓶颈。
资源推荐
资源详情
资源评论
大数据安全技术研究进展大数据安全技术研究进展
陈性元, 高元照, 唐慧林 and 杜学绘
Citation: 中国科学: 信息科学 50, 25 (2020); doi: 10.1360/N112019-00077
View online: http://engine.scichina.com/doi/10.1360/N112019-00077
View Table of Contents: http://engine.scichina.com/publisher/scp/journal/SSI/50/1
Published by the 《中国科学》杂志社
Articles you may be interested in
纳米生物仿生技术研究进展
SCIENTIA SINICA Vitae
农业机器人技术研究进展
SCIENTIA SINICA Informationis 40, 71 (2010);
药物分析检测技术研究进展
SCIENTIA SINICA Vitae 41, 904 (2011);
蛙人探测声纳技术研究进展
Chinese Science Bulletin 54, 269 (2009);
味觉传导机理及味觉芯片技术研究进展
Chinese Science Bulletin 50, 1425 (2005);
SCIENTIA SINICA Informationis
中国科学 : 信息科学 2020 年 第 50 卷 第 1 期 : 25–66
c
2020 《中国科学》杂志社 www.scichina.com infocn. scichina.com
评述
大数据安全技术研究进展
陈性元
1,2*
, 高元照
1,2
, 唐慧林
1
, 杜学绘
1
1. 信息工程大学三院, 郑州 450001
2. 密码科学技术国家重点实验室, 北京 100094
* 通信作者. E-mail: chxy302@vip.sina.com
收稿日期: 2019–04–18; 接受日期: 2019–06–27; 网络出版日期: 2020–01–08
国家重点研发计划 (批准号: 2018YFB0803603) 和科技创新特区 (批准号: 18-H863-01-ZT-005-017-01) 资助项目
摘要 大数据是经济发展的新动能, 社会发展的新引擎, 塑造国家竞争力的战略制高点, 对人民生活
具有重大影响. 然而随着社会对数据价值认知的提升和大数据平台建设的蓬勃发展, 大数据安全问题
日益成为阻碍大数据应用推广的瓶颈. 同时, 由于大数据技术、框架仍在不断演变当中, 研究人员对大
数据安全内涵的核心认知和关键特征理解还存在差异, 尚未形成相对统一的大数据安全框架. 当前亟
需对大数据安全技术发展现状进行梳理, 为大数据安全重点问题的研究和突破提供参考. 本文结合典
型大数据系统技术框架, 围绕大数据安全需求, 构建了大数据安全技术框架. 在此框架下, 从大数据安
全共享与可信服务、大数据平台安全和大数据安全监管 3 个方面系统梳理了大数据安全关键技术的
研究现状, 囊括了大数据业务流程和大数据系统技术框架所涉及的主要安全机制. 最后总结了大数据
安全技术有待解决的核心问题和发展趋势.
关键词 大数据安全, 安全技术框架, 数据安全共享, 平台安全, 安全监管
1 引言
自 “大数据” 概念由全球数据科学权威维克托 · 迈尔 - 舍恩伯格 (Viktor Mayer-Sch¨onberger) 在
《大数据时代》一书中明确提出以来, 大数据引起了学术界、产业界和各国政府的广泛关注. N ature 和
Science 等期刊发表专刊探讨大数据带来的机遇与挑战. 达沃斯世界经济论坛发布报告《Big Data, Big
Impact》宣称数据已经成为一种新的经济资产类别. 美英等世界上主要国家相继发布大数据战略
1)
, 我
国国务院也于 2015 年发布《促进大数据发展行动纲要》, 以国家为主导的大数据快速发展时代已经到
来. 当前, 大数据应用正不断向电子商务、智慧城市、国防建设、科学研究等众多领域推广.
1) 世界主要国家的大数据战略和行动. 2015. http://www.cac.gov.cn/2015-07/03/c 1115812491.htm.
引用格式: 陈性元, 高元照, 唐慧林, 等. 大数据安全技术研究进展. 中国科学: 信息科学, 2020, 50: 25–66, doi: 10.1360/
N112019-00077
Chen X Y, Gao Y Z, Tang H L, et al. Research progress on big data security technology (in Chinese). Sci Sin Inform,
2020, 50: 25–66, doi: 10.1360/N112019-00077
Downloaded to IP: 192.168.0.213 On: 2020-05-02 02:33:20 http://engine.scichina.com/doi/10.1360/N112019-00077
陈性元等: 大数据安全技术研究进展
大数据在给生产、生活方式带来变革的同时, 其安全问题也日益凸显. 2017 年美国征信机构
Equifax 数据泄露, 导致几乎全美一半人口的个人敏感信息掌握在黑客手中, 同年美国国家安全局 (Na-
tional Security Agency, NSA) 数据泄露, 美军超过 100 GB 的绝密数据暴露在亚马逊云上
[1]
. 2018 年,
剑桥分析公司非法收集 Faceb ook 用户信息, 并基于分析结果干预美国大选
2)
. 上述安全事件表明, 加
快大数据安全技术研究, 已成为保障信息化建设和数字经济稳步向前推进的迫切要求.
然而, 不同于传统数据, 大数据具有体量大 (volume) 、多样性 (variety) 和速度快 (velocity) 等特
性
[2]
, 这为安全技术在大数据环境下的应用带来了极大挑战. 同时, 为实现大数据的有效处理还引入了
分布式的计算与存储框架. 这些新型框架也带来了新的安全威胁. 当前, 大数据安全研究仍处于初期,
研究人员对大数据安全的核心认知和关键特征理解还存在差异, 理论成果同实际应用要求之间还存
在差距, 亟待对大数据安全技术的发展现状进行系统梳理, 为大数据安全重点问题的研究和突破提供
参考.
本文结合大数据业务流程和大数据系统技术框架, 分析了大数据安全关键技术的研究进展, 在此
基础上总结大数据安全中有待解决的挑战性问题和解决思路, 探讨大数据安全的发展趋势. 第 2 节在
总结大数据安全技术主流分类视角和主要内容的基础上, 提出一种大数据安全技术框架; 在该框架下,
第 3 节从数据价值链的角度梳理了大数据安全共享与可信服务中的安全技术; 第 4 节则从 IT 价值链
的视角梳理了大数据平台安全技术; 第 5 节综合数据、服务与平台 3 个方面梳理了大数据安全监管技
术; 第 6 节总结全文并对大数据安全技术研究的未来趋势进行展望.
2 大数据安全技术框架
建立有效的大数据安全技术框架, 能够为大数据系统的安全技术研究与部署提供指导. 本节首先
对当前有代表性的大数据安全技术分类视角和包含内容进行介绍, 在此基础上, 提出一种大数据安全
技术框架.
2.1 大数据安全技术的分类视角
对大数据安全技术进行合理分类与组织, 是构建大数据安全技术框架的基础. 当前, 代表性的分
类视角主要有基于大数据生命周期的分类和基于大数据系统技术框架的分类.
基于大数据生命周期的分类方式按照生命周期的不同阶段对相关安全技术进行分类
[3∼6]
. 由于所
关注安全需求的不同, 不同研究人员对大数据生命周期的划分和每个阶段涉及技术的理解差异较大.
例如文献 [4] 将大数据生命周期分为数据生成、存储和处理 3 个阶段. 数据生成阶段主要采取访问控
制、数据伪造等手段防止数据的非授权采集和隐私泄露; 数据存储安全包括数据加密和完整性验证;
处理安全包括隐私保护数据发布和隐私保护数据挖掘. 文献 [5] 将大数据生命周期分为数据发布、数
据存储、数据分析和数据使用 4 个阶段. 其中, 数据发布与分析阶段分别对应于文献 [4] 的数据生成
和处理阶段, 而在所包含的安全技术上, 发布和分析两个阶段的安全技术与文献 [4] 处理阶段的安全
技术基本一致. 在数据使用阶段, 主要涉及多种访问控制技术.
基于大数据生命周期的分类方式与大数据业务处理流程耦合比较紧密, 对建立大数据安全技术框
架有一定的指导意义, 但考虑到在大数据的生命周期中, 一些安全技术可能出现在多个阶段 (例如: 数
据在存储、分析、发布等过程中的安全, 都会涉及到访问控制), 建立大数据安全技术框架并不能完全
2) Facebook 数据泄露. 2018. http://opinion.china.com.cn/event 5141 1.html.
26
Downloaded to IP: 192.168.0.213 On: 2020-05-02 02:33:20 http://engine.scichina.com/doi/10.1360/N112019-00077
中国科学 : 信息科学 第 50 卷 第 1 期
按照生命周期的方式. 并且这种方式主要关注数据的安全与隐私, 缺乏对大数据平台安全与安全监管
的考虑, 而这也是大数据安全的重要组成部分.
基于大数据系统技术框架的分类方式对大数据系统面临的安全挑战进行归纳, 按照保护对象以及
所要解决的安全问题对安全技术进行分类. 该分类方式中, 有代表性的是国际云安全联盟 (Cloud Se-
curity Alliance, CSA)
[7]
和美国国家标准与技术研究院 (National Institute of Standards and Technology,
NIST)
[8]
提出的分类. CSA 将大数据安全技术划分为基础设施安全、数据隐私、数据管理以及完整
性和被动安全 (reactive security) 4 个方面. NIST 将大数据安全分为设备与应用注册、用户身份与访
问管理、数据治理、基础设施管理, 以及风险与追责 5 个方面. CSA 和 NIST 所提分类基本涵盖了大
数据与大数据平台所涉及的主要安全技术, 但没有结合大数据系统技术框架对安全技术进行进一步组
织或明确阐述不同安全技术之间的关系, 难以很好地指导安全技术在大数据系统中的部署. 阿里巴巴、
奇虎 360、IBM 等众多互联网企业也从大数据系统技术框架的角度对安全技术进行了归纳
[9]
, 但所提
安全技术框架主要结合自身业务特点, 通用性不强.
此外, 文献 [10∼12] 等介绍大数据安全的综述性文献对大数据安全所需关注的挑战性问题进行了
阐述, 但没有提出明确的安全技术分类, 这些文献在学术研究上有很好的借鉴意义, 但在大数据安全
技术框架的构建上指导性较弱.
综上所述, 基于大数据生命周期和基于大数据系统技术框架的分类方式各有优点, 但也存在一定
局限性. 2.2 小节将综合运用这两种安全技术的组织方式, 并结合 NIST 提出的大数据参考架构, 提出
一种大数据安全技术框架.
2.2 技术框架
2015 年, NIST 提出一种大数据参考架构, 将大数据系统参与者划分为数据提供者、数据消费者、
大数据应用提供者和大数据框架提供者 4 种角色
[8]
. 其中, 应用提供者执行数据的采集、预处理、分
析、可视化和访问, 框架提供者提供数据的处理、存储框架和基础设施.
NIST 大数据参考架构在国际国内都有较大的影响力, 国际标准化组织/国际电工委员会下的大数
据工作组、我国信息技术标准化技术委员会在建立大数据参考架构时都参考了 NIST 所提架构
[13, 14]
.
因此, 本文基于 NIST 架构, 结合大数据业务流程和大数据系统技术框架组成特点, 兼顾数据安全与平
台安全、安全防御与安全管理, 提出符合大数据业务特点的安全技术框架, 如图 1 所示.
该框架将大数据安全技术划分为大数据安全共享与可信服务、大数据平台安全和大数据安全监管
3 部分, 在对大数据安全技术进行比较系统的学术归纳的同时, 更重要的是考虑了大数据安全技术框
架与大数据系统框架间的耦合. 该框架将大数据安全技术与大数据系统的主要组成部分进行对应, 使
得大数据安全需求更加明确, 安全技术的服务对象也更加明确, 有利于指导大数据安全技术的研究与
部署.
大数据共享与服务主要面向用户, 为用户提供数据共享与分析的接口. 大数据安全共享与可信服
务是大数据安全的根本, 主要解决数据共享与服务过程中的价值激励、安全信任与隐私保护等问题,
具体包括基于数据迁移的数据安全共享、基于计算迁移的多中心协同可信服务和数据服务隐私保护
与脱敏. 其中, 数据迁移和计算迁移代表了数据共享的两种方式, 计算迁移采用移动计算而非移动数
据的方式实现数据的间接共享.
大数据平台为大数据共享与服务提供数据存储与处理的基础支撑, 负责数据存储、处理和访问等
的实际执行. 大数据平台安全是大数据安全的基础, 主要包括大数据处理安全、大数据存储安全、基
础设施安全和大数据访问控制. 其中, 大数据存储安全是平台安全的重中之重, 并以密码技术作为核
27
Downloaded to IP: 192.168.0.213 On: 2020-05-02 02:33:20 http://engine.scichina.com/doi/10.1360/N112019-00077
陈性元等: 大数据安全技术研究进展
Big data platform security
Task scheduling
security and isolation
Task execution security
Big data secure sharing and trusted service
Big data
security supervision
Integrated security
situation awareness
Big data
access control
Big data
processing security
Big data
storage security
Infrastructure security
Data integrity verification
Provable
data possession
Data disaster
recovery
Virtual resource security
Virtualized computing and
storage resource security
Homomorphic
encryption
Attribute-based
access control
Role-based
access control
Proofs of
retrievability
Computing migration based
multi-center collaborative trusted service
PHE
Virtualized
network security
Physical resource security
Conventional
attribute policy
based access control
Format-
preserving
encryption
Data migration based
data secure sharing
Privacy protection
and data masking
FHE SSE PEKS OPE
Searchable encryption
E
ncryption
Platform supervision
Service supervision
Data supervision
Attribute-based
encryption
SWHE
图 1 (网络版彩图) 大数据安全技术框架
Figure 1 (Color online) Big data security technology framework
心. 同态加密、可搜索加密、保留格式加密和属性加密等密码机制不仅能够提供数据机密性保护, 还
能为密态数据的统计、分析、搜索和访问控制等提供支持.
大数据安全监管是大数据安全的保证, 主要解决数据自身、大数据服务和大数据平台安全的监控
与评估等问题, 具体包括数据监管、平台监管、服务监管和综合安全态势感知.
本文后续章节将依据提出的大数据安全技术框架对各安全技术的研究现状和存在的问题进行详
细介绍.
3 大数据安全共享与可信服务
本节首先介绍大数据安全共享与可信服务面临的利益藩篱和隐私泄露等问题, 然后介绍针对利益
藩篱等问题的两种数据共享方式: 基于数据迁移的数据安全共享和基于计算迁移的多中心协同可信服
务, 最后介绍针对隐私泄露问题的数据服务隐私保护与脱敏.
3.1 面临的问题与解决方案
数据的高度共享与充分利用是实现大数据价值、提升大数据效能的核心目标. 然而由于利益藩篱
和数据安全担忧, 在数据共享过程中需要考虑价值激励、责任认定、安全信任等问题, 这些问题的难以
解决导致了大数据 “不愿、不敢、不能” 共享的难题. 此外, 鉴于大数据的广泛集成和深度挖掘, 隐私
28
Downloaded to IP: 192.168.0.213 On: 2020-05-02 02:33:20 http://engine.scichina.com/doi/10.1360/N112019-00077
剩余42页未读,继续阅读
资源评论
syp_net
- 粉丝: 158
- 资源: 1196
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功