论文研究-多版本数据仓库的查询优化设计.pdf

所需积分/C币:9 2019-09-08 19:28:31 455KB .PDF
14
收藏 收藏
举报

多版本数据仓库中,不同数据仓库版本的维度实例可以共享存储。直接建立维度表与事实表的位图连接索引会产生大量无用的索引项,影响查询效率。给出了一种数据仓库版本的形式定义和维度实例的共享存储方式,并在此基础上设计了查询优化算法DWVOQ,通过建立维度实例的版本视图及其与事实实例的连接索引来降低索引空间代价,提高索引查询效率。
鲍蓉:多版本数据仓库的查询优化设计 2008,44(28)145 维度实例,且虚拟视图中的字段el(RB)∈ UBUfield(F)用直接索引和 DwvoQ优化算法执行查询Q,查询性能比较如 图2所示,可以看出, DWVOQ算法可以显著提高查询效率 (5)建立维度表虚拟视图(Rm…RD)与TRm的连接,完成子 Q: select A1,A2, sum(A,) 查询 from RE, Rm, Rp, Rel QS=∏xA(O(Rm…∞ RD noTRe) where Ro Roid=RhRoL id and Rm. Rm id=Rn.Rm id and Rm.Rm id=Ro.Rm id and a=a 4 DWVOQ算法的性能介析 设数据仓库版本DWV1的事实表Rn中包含10°条记录, 记录长度为16个字节,F1有3个参考维度表,如表2所示。 ②直接索引查询 表2DWV的维度表参数 维度表主码长度记录长度总记录数DWV记录数 ① DwvoQ查询 2 Byle 50 Byle 1000 300 2 Byte 30 Byte 200 2×10° 4×10° R 2 Byte 20 By bvte 100 事实表Rn的记录数 图2 DwvOQ查询优化算法与直接索引查询的性能比较 子査询连接条件为全连接,查询属性A1∈Rm,A2∈Rm A3∈Rm, length(A1)= length(A2)= length(A3)=10Byte,不考虑分 结束语 组条件,查询优化算法 DwvoQ的空间代价包括: 在多版本数据仓库中,维度表的记录可以属于多个不同的 (1)建立维度实例视图代价 数据仓库版本,直接建立维度表与事实表的位图连接索引会产 cost(rvm)+cost(rvm)+cost(R)= 生大量无用的索引项,影响查询效率。查询优化算法 DWVOQ 2×300+2×200+2×50=1100Byte 通过建立维度表的版本视佟连接索引,降低索引的空间代价, (2)建立位图连接索引代价 有效提高了多版本数据仓库的查询效率。 cost(BJI)cost(BJ)+cost(BJP) 300×10°+200×10+50×10°≈7×107bit=9×10Byte (3)临时事实表TRn的最大代价 参考文献 cOst(TRn)a=300×200×50×16=48×10°Bye [1 Wrembel R, Morzy T Multiversion data warehouses: challenges and (4)虚拟视图的代价 solutions[ C/Proc of the 3rd IEEE Conference on Computational Cybcrnctics(ICCC 2005), Mauritius, April 2005 COst(rn)+cost(Rm)+Cost(Rm)= [2] Morzy T, Wrembel R On querying versions of multiversion data 300×(2+10)+200×(2+10)+50×(2+10)=6600Byte warehouse[C]/proc of the 7th ACM Int Workshop on Data Ware (5)建立查询连接最大代价 housing and OlAP, Washington, USA, November 2004: 92-101 cost (Rm∞Rm∞Rm∞TRn)m 3]黄震华,薛永生.一种复杂多维层次的连接和聚集算法门计算机研 300×200×50×(16+30)=138×10Byte 究与发展,2004,41(8):1345-1350 执行QS的总查询代价 14]文娟,薛永生数据仓库中的一种提高多表连接效率的有效方法小 cost(QS)=1100+9×10+48×109+6600+138×10°≈ 计算机研究与发展,2005,42(11):2010-2017 195×10°Byte [5 Grandi F A relational multi-schema data model and query lan guage for full support of schema versioning[ C/Proc of the 1Oth 如果直接建立维度表与事实表的位图连接索引,则査询总 SEBD,2002. 代价: 6 Bebel B, Eder J, Koncilia C, et al. Creation and management of ver- Ost(QS)=(1000×109+500×10°+100×10°)/8+ sions in multiversion data warehouses[C]//ACM SAC 2004, March 300×200×50×(16+48+28+18)=530×10°Byte 2004,N Cypres, ACM ISBN 1-58113-812-1 从查询空间代价来看,采用 DWvoQ算法占用的查询空间(7] Bebel b, Krolikowski z, Wrembe e. Formal approach to modeling a 远远小于直接査询位图连接索引査询。 multiversion data warehouse[R]. Bulletin of the Polish Academy of 在SQL- Server系统建立上述虚拟数据仓库版本,分别采 Sciences, Technical Sciences, 2006, 54(1) (上接97页) [8 Cortes C, Vapnik V N Support vector networks[J) Machine Learnin 5 Vapnik V N. An overview of statistical learning theory.IEEE Trans 1995,20(3):273-297. actions on Neural Networks, 1999, 10(5): 988-999 [9 Ren He, Zeng Jun-fang. A Chinese word extraction algorithm based 6]何建兵,何清,史忠植基于SMO的多层次文本分类法研究J计算 on information entropy[J]-Journal of Chinese Information Processing 机工程与应用,2006,42(13):152-154 2006,20(5):40-43 [7] Sebastiani F Machine learning in automated text categorization [J. [10] Koprinska I, Poon J. Learning to classify e -mail [J].Information ACM Computing Survey, 2002, 34(1): 1-47 Sciences,2007,177(10):2167-2187

...展开详情
试读 3P 论文研究-多版本数据仓库的查询优化设计.pdf
立即下载
限时抽奖 低至0.43元/次
身份认证后 购VIP低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

关注 私信
上传资源赚钱or赚积分
最新推荐
论文研究-多版本数据仓库的查询优化设计.pdf 9积分/C币 立即下载
1/3
论文研究-多版本数据仓库的查询优化设计.pdf第1页

试读结束, 可继续阅读

9积分/C币 立即下载