旗开得胜
一、数据仓库的架构
数据仓库(Data Warehouse DW)是为了便于多维分析和多角度展现而将数据按特定的模式进
行存储所建立起来的关系型数据库,它的数据基于 OLTP 源系统。数据仓库中的数据是细节的、
集成的、面向主题的,以 OLAP 系统的分析需求为目的。
数据仓库的架构模型包括了星型架构(图二:pic2.bmp)与雪花型架构(图三:pic3.bmp)两
种模式。如图所示,星型架构的中间为事实表,四周为维度表,类似星星;而相比较而言,雪花
型架构的中间为事实表,两边的维度表可以再有其关联子表,从而表达了清晰的维度层次关系。
从 OLAP 系统的分析需求和 ETL 的处理效率两方面来考虑:星型结构聚合快,分析效率高;而
雪花型结构明确,便于与 OLTP 系统交互。因此,在实际项目中,我们将综合运用星型架构与雪
花型架构来设计数据仓库。
那么,下面我们就来看一看,构建企业级数据仓库的流程。
二、构建企业级数据仓库五步法
(一)、确定主题
即确定数据分析或前端展现的主题。例如:我们希望分析某年某月某一地区的啤酒销售情况,这
就是一个主题。主题要体现出某一方面的各分析角度(维度)和统计数值型数据(量度)之间的
关系,确定主题时要综合考虑。
我们可以形象的将一个主题想象为一颗星星:统计数值型数据(量度)存在于星星中间的事实表;
分析角度(维度)是星星的各个角;我们将通过维度的组合,来考察量度。那么,“某年某月某
一地区的啤酒销售情况”这样一个主题,就要求我们通过时间和地区两个维度的组合,来考察销
售情况这个量度。从而,不同的主题来源于数据仓库中的不同子集,我们可以称之为数据集市。
数据集市体现了数据仓库某一方面的信息,多个数据集市构成了数据仓库。
(二)、确定量度
1
读万卷书 行万里路