没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
为了分析DBLP数据中的多种类型的实体信息,挖掘其中特定的知识,首先根据异质网络Graph OLAP(图联机分析处理)模型,建立相应的数据仓库模型;然后依据实体维的概念,构建多维异质图立方模型;最后针对 Graph OLAP处理异质网络能力不足的问题,补充了旋转和拉伸操作,并完善了Graph OLAP原型系统Liter Miner。实证表明设计的原型系统可以有效地对DBLP数据中的多维异质网络进行分析,挖掘出研究人员需要的知识。
资源推荐
资源详情
资源评论
收稿日期:20130702;修回日期:20130829
作者简介:邵连龙(1987),男,天津人,硕士研究生,主要研究方向为数据挖掘(along2506@126.com);尹沐(1988),男,北京人,硕士研究生,
主要研究方向为数据挖掘.
基于 DBLP数据的多维异质网络
GraphOLAP设计与实现
邵连龙,尹 沐
(北京邮电大学 北京市智能通信软件与多媒体重点实验室,北京 100876)
摘 要:为了分析 DBLP数据中的多种类型的实体信息,挖掘其中特定的知识,首先根据异质网络 GraphOLAP
(图联机分析处理)模型,建立相应的数据仓库模型;然后依据实体维的概念,构建多维异质图立方模型;最后针
对 GraphOLAP处理异质网络能力不足的问题,补充了旋转和拉伸操作,并完善了 GraphOLAP原型系统 Liter
Miner。实证表明设计的原型系统可以有效地对 DBLP数据中的多维异质网络进行分析,挖掘出研究人员需要的
知识。
关键词:图挖掘;图联机分析处理;数据仓库;图立方体
中图分类号:TP391 文献标志码:A 文章编号:10013695(2014)03072005
doi:10.3969/j.issn.10013695.2014.03.019
HeterogeneousmultidimensionalGraphOLAPdesignand
implementationbasedonDBLP
SHAOLianlong,YINMu
(BeijingKeyLaboratoryofIntelligentTelecommunicationsSoftware& Multimedia,BeijingUniversityofPosts& Telecommunications,Beijing
100876,China)
Abstract:Whenwewanttoanalyzetheentityinformationandminethenecessaryknowledge,accordingtotheheterogeneous
multidimensionalGraphOLAP(graphonlineanalyticalprocessing)framework,firstlythispapermodeledtheheterogeneous
multidimensionalGraphOLAPdatawarehouse
,thenmodeledtheheterogeneousmultidimensionalgraphcubetoadapttoen
titydimensionalanalysis.FinallyitaddedrotateandstretchoperationstosolvetheproblemofGraphOLAP’spoorabilityto
wardsheterogeneousnetwork,andimplementedheterogeneousmultidimensionalGraphOLAPprototype,LiterMiner.Itis
proveseffectiveonanalyzingheterogeneousnetworksinDBLPdataandminingtheknowledgethatisneededbyresearchers.
Keywords:graphmining;OLAP;datawarehouse;graphcube
!
引言
1993年关系数据库之父 Codd提出联机分析处理(OLAP)
的概念,它成为继联机事务处理(OLTP)之后,数据处理及相关
数据库领域的热门问题。十多年来从理论研究到实用工具、产
品及商业应用取得很大发展,
OLAP已经逐渐成为一项成熟的
技术。
随着对于 OLAP技术的深入研究,可以看到传统的 OLAP
技术无法支持带有图结构的网络分析。直到 2007年,吴巍
[1]
提出了 LinkOLAP的概念,通过将面向实体的分析扩展为面向
连接的分析,他发现 LinkOLAP操作在某些特定的分析场景下
能提供比传统 OLAP更优秀的解决方案。他以复杂网络可视
化为基础,将 OLAP技术应用到面向连接的分析,突破了以往
传统 OLAP系统中单调的二维表格表现方式。同年,Chen等
人
[2,3]
也提出了基于图结构的 OLAP,即 GraphOLAP的概念,
将 OLAP技术引入到复杂网络的分析中,解决含有多维度特性
的复杂网络的多维分析问题。他提出了 GraphOLAP特有的两
种维度,即信息维、拓扑维,并定义了两个维度上的 OLAP操
作,为
GraphOLAP的研究打下了理论基础,开辟了复杂网络多
维分析的一个新方向。但是最初的研究并未对 GraphOLAP的
数据仓库模型以及算法设计进行详细考虑,随后一些研究者对
这些内容进行了 补 充。2010年,Li等人
[4]
提出 了 一种 适 合
GraphOLAP的数据仓库概念模型,即双星模型,并提出了信息
维聚集算法 IOLAPing和拓扑维聚集算法 TOLAPing,实现了
GraphOLAP的原型系统 GraphOLAPer1.0。次年,Li等人
[5]
又
在原有基础上提出了基于信息网络数据仓库和信息网络数据立
方体的概念,即
InfoNetOLAPer,提出了双星座数据模型,实现了
信息维和拓扑维的聚集算法以及上卷下钻的 OLAP操作,在操
作执行方面具有较高的性能。2011年,Zhao等人
[6]
详细介绍了
一个新的数据仓库模型,即基于图的数据立方体 GraphCube,有
效地支持针对大型多维网络进行 OLAP查询。同时提出了用于
GraphOLAP的新的查询方式 crossboid,这种查询方式针对多维
网络进行交叉查询,并讨论了 GraphCube的物化策略。2011
年,Qu等人
[7]
提出了一种信息网络拓扑维的框架,并基于此框
架提出了更高效的查询方法以及数据立方体的物化策略,对拓
扑维在线分析处理(TOLAP)操作中特定类型度量的优化进行
第 31卷第 3期
2014年 3月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol.31No.3
Mar.2014
资源评论
weixin_38739900
- 粉丝: 4
- 资源: 928
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功