没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
研究报告
IBM DB2 BLU Acceleration、SAP HANA 与 Oracle Exadata 的
比较
执行摘要
问题
:如何最高效地分析大量数据(大数据)。
解决方案
:解决方案要涵盖三个方面:
1. 找到组织和压缩数据的方式,让大量数据可以占用更少的空间,并找出一
种可以读取已压缩的数据,以加快查询速度的方式;
2. 使用高效的算法,加快大数据分析的速度;
3. 选择一个可以提供均衡的资源利用率的系统环境,让 CPU 处理能力、内存、
输入/输出(I/O)、网络和存储能以均衡的方式协同工作,尽可能迅速地生成
查询结果。
三家公司(IBM、SAP 和 Oracle)都构建了旨在加快大数据分析的软件环境。然而,
各厂商在组织/查询数据的方式,以及在相关的系统设计方面存在着非常明显的差异:
IBM 的方法使用了一项创新的技术,称为 DB2 BLU Acceleration。BLU 使用
列式方法,迅速减小了大数据的数据库大小,以隔离相关的数据,有效地
快速
读取
大型数据库(这种方法使 BLU 实现了比传统基于行的方法快 10-50 倍的
性能)。IBM 的方法还使用了数据库压缩、在内存中读取已压缩数据的能力,
以及均衡的系统设计等特性;
SAP 的 HANA 依赖于将大量的列式数据放在主内存中,在那里可以实时分析
整个数据库。HANA 的数据压缩率高达 20 倍(但需要解压缩数据后才能执行
查询处理)。我们喜欢 HANA,但我们对系统资源利用率是否达到良好的均衡
存有疑问;
Oracle 自己的网站将 Exadata Database Machine 描述为“结合大规模内存
和廉价磁盘,以最低的成本提供最高的性能和 PB 级的可扩展性”。对我们来
说,Exadata 是一个高度调优的 Oracle 真正应用集群(RAC),它被打包为配
有存储的设备,使用 Oracle 数据库以及数据库内高级分析。该产品没有利用
列式数据;不读取已压缩数据;并且其压缩设施落后于 IBM 的 DB2。
更仔细地看看每家厂商的大数据分析产品,可以说明在几个方面的主要差异:缓存和
压缩数据的方式;管理工作负载的方式;使用内存的方式,以及系统内的平衡/优化。
在我们从这些角度考察各厂商的产品时,我们发现 IBM 的 DB2 和 BLU Acceleration
与 SAP HANA 和 Oracle Exadata 相比均具有较大的优势,在均衡的系统设计和性能
方面尤其明显。在此
研究报告中,Clabby Analytics
更深入地讨论了这些系统有何
差异。
资源评论
yuanjl
- 粉丝: 0
- 资源: 4
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功