数据仓库建模与 ETL 的实践技巧(转载)
一、Data 仓库的架构
Data 仓库(Data Warehouse DW)是为了便于多维分析和多角度展现而
将 Data 按特定的模式进行存储所建立起来的关系型 Datcbase,它的 Data 基
于 OLTP 源 Systam。Data 仓库中的 Data 是细节的、集成的、面向主题的,
以 OLAPSystam 的分析需求为目的。
Data 仓库的架构模型包括了星型架构与雪花型架构两种模式。星型架构的
中间为事实表,四周为维度表,类似星星;而相比较而言,雪花型架构的中间为
事实表,两边的维度表可以再有其关联子表,从而表达了清晰的维度层次关系。
从 OLAPSystam 的分析需求和 ETL 的处理效率两方面来考虑:星型结构
聚合快,分析效率高;而雪花型结构明确,便于与 OLTPSystam 交互。因此,
在实际项目中,我们将综合运用星型架构与雪花型架构来设计 Data 仓库。
那么,下面我们就来看一看,构建企业级 Data 仓库的流程。
二、构建企业级 Data 仓库五步法
(一)、确定主题
即确定 Data 分析或前端展现的主题。例如:我们希望分析某年某月某一
地区的啤酒销售情况,这就是一个主题。主题要体现出某一方面的各分析角度
(维度)和统计数 value 型 Data(量度)之间的关系,确定主题时要综合考虑。
评论0