浅析多维体系结构(总线架构),一致性维度和一致性事实
多维体系结构(MD)是数据仓库领域中的一种架构,由Kimball博士所创始。MD架构主要包括后台(Back Room)和前台(Front Room)两部分。后台也称为数据准备区(Staging Area),是MD架构的最为核心的部件。在后台,是一致性维度的产生、保存和分发的场所。同时,代理键也在后台产生。前台是MD架构对外的接口,包括两种主要的数据集市,一种是原子数据集市,另一种是聚集数据集市。
一致性维度是多维体系结构中的一个关键概念,指的是总线架构中的维度,即可能会在多个数据集市中都存在的维度。这种维度的范围是架构师来决定的。一致性维度建立的地点是多维体系结构的后台(Back Room),即数据准备区。在多维体系结构的数据仓库项目组内需要有专门的维度设计师,他的职责就是建立维度和维护维度的一致性。在后台建立好的维度同步复制到各个数据集市。这样所有数据集市的这部分维度都是完全相同的。
一致性维度在多维体系结构中起着非常重要的作用,它可以使不同数据集市之间的维度保持一致。如果维度表中的数据量较大,出于效率的考虑,应该建立物化视图或者实际的物理表。这样,维度保持一致后,事实就可以保存在各个数据集市中。虽然在物理上是独立的,但在逻辑上由一致性维度使所有的数据集市是联系在一起,随时可以进行交叉探察等操作,也就组成了数据仓库。
一致性事实是多维体系结构中的另一个关键概念,指的是在多个数据集市中保持一致的事实数据。建立一致性事实需要保证两点:第一是KPI的定义及计算方法要一致,第二是事实的单位要一致性。如果业务要求或事实上就不能保持一致的话,建议不同单位的事实分开建立字段保存。这样,一致性维度将多个数据集市结合在一起,一致性事实保证不同数据集市间的事实数据可以交叉探查,一个分布式的数据仓库就建成了。
多维体系结构(MD)是数据仓库领域中的一种架构,由Kimball博士所创始。MD架构主要包括后台(Back Room)和前台(Front Room)两部分。后台是数据准备区,是MD架构的最为核心的部件。在后台,是一致性维度的产生、保存和分发的场所。同时,代理键也在后台产生。前台是MD架构对外的接口,包括两种主要的数据集市,一种是原子数据集市,另一种是聚集数据集市。一致性维度和一致性事实是多维体系结构中的两个关键概念,它们可以使不同数据集市之间保持一致,组成了数据仓库。