没有合适的资源?快使用搜索试试~ 我知道了~
基于隐私度量的数据定价模型.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 14 浏览量
2023-03-03
19:31:35
上传
评论
收藏 971KB PDF 举报
温馨提示
试读
12页
。
资源推荐
资源详情
资源评论
基于隐私度量的数据定价模型
彭慧波;周亚建
【摘 要】有价值的数据资源充分流动,可以实现大数据产业的长期,稳定和可持续发
展.本文讨论了通过构建以合理定价为中心的数据交易机制来利用经济杠杆来激励
数据流的想法.首先,本文结合信息熵,提出了一种基于分级的交易数据集隐私度量方
法;其次,基于数据集中的隐私含量和数据引用指数提出了一种数据定价模型对待交
易数据元组进行定价;最后,结合一个实际的交易数据集验证了模型的正确性、合理
性、有效性.
【期刊名称】《软件》
【年(卷),期】2019(040)001
【总页数】6 页(P57-62)
【关键词】计算机应用技术;数据定价;隐私度量;信息熵;隐私分级
【作 者】彭慧波;周亚建
【作者单位】北京邮电大学网络空间安全学院,北京 100876;北京邮电大学网络空
间安全学院,北京 100876
【正文语种】中 文
【中图分类】TP399
0 引言
随着信息技术的快速发展,时刻都有海量数据的产生,但是这些数据都是停止不动
的,形成了一个个信息孤岛。数据作为一种在一定程度上不可共享的资源,逐渐演
变成为一种可进行交易的商品,数据资源成为人类社会一种必不可少的生产要素与
战略资产[1]。为了促进数据的流动这就需要数据交易的支持。但是,由于缺乏规
范的交易渠道和统一的交易规范,现在并没有统一的数据交易平台。而数据交易的
平稳、健康发展又离不开数据定价方法的支持。目前仍未能在全球领域内形成对数
据定价方法的统一认识。因此,如何实现数据定价理论中定价机制的公开化、数据
价格的透明化,一直是困扰国内外科研人员以及大数据从业者的重大问题。
要解决这个问题,隐私风险分析及评估不失为一种可行解决方案。但隐私风险分析
及评估,尤其是量化隐私风险,势必会涉及隐私度量问题。从这些分析来看,隐私
度量的研究具有十分重要的理论意义和应用价值。目前对于隐私度量的研究主要是
基于 Shannon 信息论的通信框架,提出了几种隐私保护信息熵模型,以解决隐私
保护系统的相关度量问题。信息熵作为信息度量的有效工具,在通信领域已展现出
其重要的贡献。为此,不少学者或多或少进行了探索,提出了比如事件熵、匿名集
合熵、条件熵形式化分析和分布概率数学理论等在内的相关理论[2]。然而这些方
法在实际应用中并不能达到理论上所提到的隐私保护的效果,并且存在不同程度的
不足或缺陷。此外,目前关于隐私度量的研究还较为零散,更多地是针对某一特定
领域,如位置隐私保护,目前还尚未形成统一的模型及体系。其应用范围也受到限
制,特别是隐私是具有时空性的,与人的主观感受也有关系,不同的人对同一隐私
的认同可能不同。然而在数据交易的过程中,隐私含量作为一个影响数据定价的重
要特征,如何衡量数据集中隐私含量就显得尤为重要。目前尚没有一种针对待交易
数据集中隐私含量的度量方式[3]。
在研究过程中本文的研究对象主要是待交易数据集中的各个元组。此外,本文做出
以下假设:(1)数据拥有者和数据购买者对数据和其中包含的敏感信息都十分关
注,出于法律等因素的约束,可信第三方不会主动泄露数据中的敏感信息;(2)
数据拥有者和数据购买者都是理性的,是否出售和购买数据都是通过合理分析得出,
包括成本、收益、风险在内的所有因素都可以用价格进行衡量;(3)本文从数据
交易平台的角度出发,结合数据本身特性分析交易数据集的价格,得出的结果均不
考虑除数据本身之外其它因素对价格所带来的影响;(4)本文所设定的模型不考
虑套利和整体折扣的情况。
基于以上论述,本文提出一种基于信息熵的隐私度量方法,并在此基础上建立基于
隐私度量的数据定价模型。
1 相关工作
包括微软、亚马逊、贵州大数据交易所、上海大数据交易中心在内的国内外数据交
易平台结合多年来的实践经验,提出了包括基于次数定价、基于固定费用定价(只
与使用时间有关)、双方税率定价(先收取基本费用,每次使用收取固定费用)、
免费增值定价(使用开放数据免费,使用额外服务收取一定费用)在内的不同数据
定价方法。
在理论研究方面,国内外科研人员也提出了各式的数据定价模型。这些定价方法可
分为人工定价和自动定价两大类。在人工定价方面,张晓玉等人根据博弈论方法,
运用“一对一”和“一对多”的讨价还价模型,对数据的价格确定过程进行了详细
分析,对数据定价协商过程进行了建模[4]。Christopher Riederer 等人提出了一
种数据拍卖模型,用户根据自身隐私信息含量提出交易底价,数据购买者在数据交
易平台上通过拍卖的方式购买经过脱敏处理的数据[5]。而在自动定价领域中,
Dusit Niyato 等人结合了经济学中 Stackelberg 模型和机器学习中的分类算法,
将数据交易分为数据提供者、数据交易服务提供者和数据消费者三个部分,数据提
供者设定数据价格为 pb,数据消费者设定数据价格为 ps,数据交易服务提供者通
过最小化 pb、最大化 ps,使 pb 尽可能逼近 ps 来实现各方利益的最大化[6]。为
了解决人工议价速率较慢的问题,Magdalena Balazinska 等人提出在元组(即数
剩余11页未读,继续阅读
资源评论
G11176593
- 粉丝: 6685
- 资源: 3万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于PHP+swoole实现的微信机器人,依赖vbot和微信网页版的功能,帮助管理微信群/聊天/踢人等+源码+开发文档+运行教程
- com.xunmeng.pinduoduo_Release_cd290ca9_ARM64.apk
- 2788727d-25a0-41b2-b6b4-265d193edb95.doc
- 基于AVR单片机的伺服电机系统研究
- Lab-Electronic Craft Practicum-2-Simulation of a Single Tube Com
- 贪吃蛇基于TypeScript
- CS-CP1-2C3WF固件
- 软件测试测试用例设计方法大全
- 计算机与网络基础知识要点学习
- 移动通信(RC-YDTX-III)实验指导书
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功