没有合适的资源?快使用搜索试试~ 我知道了~
一种卷烟营销数据细粒度血缘安全分析方法.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 90 浏览量
2023-02-23
20:13:54
上传
评论
收藏 925KB DOCX 举报
温馨提示
试读
12页
一种卷烟营销数据细粒度血缘安全分析方法.docx
资源推荐
资源详情
资源评论
摘要
卷烟营销系统非常庞大且复杂,数据来源众多,不仅仅来自于卷烟营销系统内部,也有可能来自第
三方应用系统。这些数据特点给卷烟营销数据的血缘分析带来了巨大挑战。设计一种基于代理重签
名的细粒度卷烟营销数据血缘安全分析方法,与现有数据血缘分析方法相比,不仅仅支持高效细粒
度血缘分析,也可以确保外包云数据中心服务场景下数据血缘关系的不可篡改性和可验证性。实验
结果表明,该数据血缘分析方法可以满足细粒度血缘分析需求,卷烟营销数据的血缘查询和验证效
率分别为 1 023ms 和 970ms,可以提供云数据中心环境下卷烟营销数据安全、高效的细粒度数
据血缘分析服务。
Abstract
The cigarette marketing system is usually very large and complex, and the
cigarette marketing data in this system are from many sources which include not
only the cigarette marketing system itself but also the third-party systems. These
data characters always bring great challenge to the bloodline analysis of cigarette
marketing data. In this work, we design a fine-grained bloodline analysis method
of cigarette marketing data based on the proxy re-signature protocol. Comparing
with the existing solutions of data bloodline analysis, the proposed method can
support fine-grained bloodline analysis and ensure the data bloodline is not
tampered in the cloud outsourcing service scenario. The experimental results
validate that the proposed method satisfies all the requirements of bloodline
analysis of cigarette marketing data. By the proposed algorithm, the query
efficiency and the verification efficiency of bloodline analysis of cigarette data reach
1,023 milliseconds and 970 milliseconds. which are able to provide efficient,
secure and fine-grained bloodline analysis services for cigarette marketing data
under the scenario of cloud data center.
译
关键词
血缘分析; 代理重签名; 卷烟营销数据
Keywords
bloodline analysis; proxy re-signature; cigarette marketing data
译
0 引言
随着大数据时代的来临,数据作为重要的企业资产越来越受到重视,面对纷繁复杂的企业数据,如
何挖掘和利用其中的信息和知识成为企业大数据分析的关键。数据血缘
[ 1]
描述了数据从产生,并
随时间推 移而演变的整个过程,数据血缘分析的应用领域非 常广,包括数据质量评价、数据核查、
数据恢复和数据引用等。本文以卷烟营销系统为研究对象,研究卷烟营销系统中数据血缘分析问题。
卷烟营销 系统庞大且复杂,主要可以分为计划管理、需求预 测、货源组织、货源供应、订单管理、
客户服务、品牌管理、市场监测、网建管理、综合管理等十大业务环节,各业务环节之间有着复杂
的数据引用关联关系。涉及的主要业务平台系统包括:省级营销平台、一体化服务平台、市综合业
务平台等 。营销系统中的数据有可能来自于其他多个数据源 ,甚至是来自外部第三方应用。同时,
即使是同一数据集的数据也有可能来自不同的数据源,这些数据关系的复杂性和不确定性都给卷烟
营销数据的血缘分析带来了巨大挑战。因此,当前我国省级卷烟营销系统亟需一种高效、支持细粒
度的数据血缘追溯分析解决方案。
云计算具有动态可扩展、按需付费、集中管理和算力强大等优点,因此对于企业而言,将传统业务
迁移到云 端已成为一种必然的技术选择。现有云架构大致可 以分为公有云、私有云和混合云架构。
目前,公有云发展较快,但是公有云属于托管性质,云租户缺乏对物理设备的控制权,因此,很多
企业和机构出于安全性考虑而选择部署私有云数据中心的方式来集成管理企业内部信息系统。企业
选择部署私有云是由于私有云具有更高的安全性和可控性,但是实际运营过程中,私有云数据中心
也面临着安全隐患。现有省级卷烟营销平台往往采用混合云的架构,在外包云数据中心环境下如何
保障数据血缘分析的安全性和高效性是卷烟营销数据血缘分析面临的又一巨大挑战。
1 相关工作
数据血缘 技术对多源数据集成、演化过程进行分析、研究, 获取原始数据到目标数据的具体生成、
转换流程。数据血缘包括静态的源数据信息和动态的数据演化过程。针对数据血缘分析,Cui 等
[ 2]
从数据库关系运算符操作出发,定义了数据血缘的具体流程,例如 SPJ 段是通过查询、投影和选择
操作构成的标准形式查询。在后续研究
[ 3-4 ]
中,基于数据血缘分析的定义,进一步构建数据血缘分
析的完整体系,从操作对应的元组起源、数据起源追踪查询、数据分割操作、视图元组起源到数据
集合起源 等,并给出了数据血缘查询的具体系统实现,但是 该方法需要对全局数据模型进行建模,
并不能很好地解决多源数据应用场景下的数据血缘验证问题。Buneman 等
[ 6 ]
利用辅助数据库对
数据血缘信息进行管理,根据使用者对辅助数据库的操作来追溯使用者的操作,这种方法需要额外
构建辅助数据库,而且在大数据量并发操作场景下,保持事务一致性给云数据服务中心会带来很大
压 力 。 Ruan 等
[ 9 ]
针 对 区 块 链 设 计 一 种 细 粒 度 、 安 全 、 高 效 的 区 块 链 数 据 溯 源 系 统
LineageChain。朱运磊等
[ 10]
利用布尔公式、逻辑蕴含和图模型的性质及等价转换机制,将不确
定性数据的世系表达式等价地转换为贝叶斯网络,并基于贝叶斯网络的概率推理对查询请求进行应
答。
上述方法利用各类辅助数据完成数据血缘查询任务,近年来随着云计算的兴起,云数据库成为企业
管理海量数据的主要选择。但外包云数据库服务模型中云计算中心并不完全可信,如何保障数据血
缘审计的安全性和可验证性成为数据血缘查询研究的重要研究方向,利用密码学方法保证数据血缘
安全查询是主要技术方案。Porkodi 等
[ 11]
设计一种基于混合属性加密的数据溯源方法,该溯源方
法可以实现基于区块链针对物联网数据流的高效、安全溯源操作。Simon 等
[ 12]
针对数据存储优化
场景,提出了一种基于图数据库的医疗应用数据溯源方法,保障在云平台环境下医疗数据的高效溯
源。Marchetti 等
[ 22]
提出一种针对网络中数据泄露的溯源追踪方法,利用有向无环图及 K-means
聚类等方法对网络流量监控识别,从而确定大型网络中恶意活动的特定主机。Priebe 等
[ 14]
利用水
印技术嵌入加密安全标签和安装监视器的方式使得云租户能够实时监控其数据流。Bertino 等
[ 15]
将数据溯源技术、机密访问控制以及可信计算相结合,提出一种构建安全数据来源路线链图的方式,
确保不影响人员隐私的情况下,实现数据来源的高度保证。
然而,上述方法并不能很好地兼顾外包云数据服务中心场景下数据血缘分析的高效性和安全性。近
年来,大数据技术普遍应用于我国烟草数据平台和信息系统建设
[ 7-8 ]
,我国卷烟营销系统大多基于
云服务平 台建设,但目前缺乏有效的烟草营销数据血缘分析 解决方案。本文借鉴代理重加密方法,
研究云环境下的卷烟营销数据血缘分析方法,实现了混合云模式下安全、高效的细粒度数据血缘分
析服务。
2 基于代理重签名的卷烟营销数据细粒度血缘分析
方法
为了实现数据血缘的细粒度、高效查询,设计基于代理重签名的卷烟营销数据血缘分析方法,首先
介绍用到的密码学工具,包括代理重签名算法和双线性映射,然后介绍卷烟营销数据,最后介绍卷
烟营销数据的血缘查询分析方法。
2.1 代理重签名算法
代理重加密
[ 5]
由一组多项式时间算法:KeyGen、ReKey、Sign、ReSign、Verify 组成。代理重
加密算法允许一个半可信的机构(云数据中心)将用户 Alice 的加密数据安全地转换成另一个用户
Bob 的加密数据。对于安全的代理重加密算法而言,半可信机构不能通过代理重加密算法本身或分
析存储的加密数据、收到的通信消息以获取任何参与者(Alice,Bob)信息。本文假设云数据中心
是半可信 的,即云数据中心会正确执行协议,但是云数据中 心存在猜测平台用户秘密信息的可能。
2.2 双线性映射
设 G
1
和 G
2
是两个阶为素数 p 的循环群,g 是 G
1
的一个生成元,若映射 e: G
1
×G
1
→G
2
为一个双
线性映射,则映射 e 满足以下条件:①双线性:∀a,b∈Z*p,满足 e(g
a
, g
b
)=e(g, g)
ab
;②
非退化性:e(g, g)≠1∈G
2
,其中 1 代表 G
2
群的单位元;③可计算性:∀g1,g2∈G1,存在一个
有效的算法,可以在多项式时间内计算 e(g
1
, g
2
)。
2.3 卷烟营销数据
卷烟营销系统数据复杂,有可能来自烟草公司的基础数据,或者来自卷烟营销系统内部。为了进行
卷烟营销数据血缘分析,将卷烟营销系统平台数据分成 3 类:B 表、K 表、R 表。
B 表为基础表,接口表入库后被命名为 B 表。B 表来源于源端业务系统,即基础业务层的原始粒度
数据。
K 表为加工过程表,其数据由 B 表加工生成,可能来自一个或多个 B 表。B 表加工后形成共享程度
高,业务含义也丰富的 K 表。
R 表为业务指标表,其数据有 B 表和 K 表数据加工生成,将数据按业务单元、分析主题进行加工
整合,用于对外提供数据服务。
卷烟营销数据中心内 B 表、K 表、R 表须严格遵守数据分层存储、层级间加工转换规则:①K 层数
据表可由 B 层、K 层数据表加工而成;②R 层数据表可由 B 层、K 层数据表加工而成;③R 层数据
表不能生成 R 层数据表。
剩余11页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3966
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功