大数据多维分析平台实践方案
大数据多维分析平台实践方案
一、大数据多维分析平台搭建的初心
随着公司业务量的增长,基于传统关系型数据库搭建的各种报表
查询分析系统,性能下降明显。同时由于大数据平台的的日趋完善,
实时的核心业务数据逐步进入大数据平台。
数据进入了大数据平台,相伴而来的是各种业务需求,这里主要聚焦
在如何高效稳定的基于大数据平台的数据进行查询。
通过分析,我们面临的挑战如下:
•亿级别表下任意维度和时间跨度的高效的统计查询。
•业务分析的维度越来越多,是否可以提供一个灵活的多维度组合查
询的工具,而不是针对不同的维度组合开发不同的报表。
基于以上目标,开始搭建大数据的多维分析平台。
二、多维分析平台技术选型
搭建多维分析平台,首先面临的是技术选型,基于我们对开源框架的
使用经验和实际情况,我们主要看业界主流的公司是如何使用应对
的,在技术选型上会进行一定的比较,但不会投入比较大的资源进行
验证,主张快速的迭代,效果的评估。多维分析平台技术选型主要面
临是 OLAP 引擎和前端 UI 的选型。
我们先来看一下 OLAP 的基本概念和分类。
OLAP 翻译成中文叫联机分析处理,OLTP 叫联机事务处理。OLTP
它的核心是事务,实际上就是我们常见的数据库。我们业务数据库就
是面向于事务。它的并发量会比较高,但是操作的数据量会比较小。
它是实时更新的。数据库的设计会按照 3NF 范式,更高的话可能会