数据仓库维度建模笔记
2009-03-24 20:01
《数据仓库工具箱—维度建模的完全指南》是数据仓库建模方面的经典著
作, 1996 年第一版出版被认为是数据仓库方面具有里程碑意义的事件。作者
kimballl 是数据仓库方面的权威,他将多年的数据仓库建模实战经验、技巧融
入本书。他提出的许多维度建模概念被广泛应用于数据仓库的设计和开发中。
2002 年本书出版了第二版。
这是一部非常好的数据仓库建模的书,前后完整的读了三遍,受益匪浅。
以下笔记将本按四个部分组织:一、数据仓库体系结构和建模过程、技巧。
二、维度表建模技术。三、事实表建模技术。四、行业建模经验。
一、数据仓库体系结构和建模过程、技巧
关键点:数据仓库体系结构、维度建模的四个步骤、数据仓库总线结构、一
致性维度。
1、对于数据仓库来说,业务需求是第一位的。
2、数据仓库的目标:(1)、随心所欲的访问数据。直观、明显、简单、易
用、切割、合并、下钻、上卷。(2)、一致的展现数据(相对于原来从多个系
统中出来的报表不一致)。(3)、适应性、扩展性、可维护性。(4)、为领导
决策提供支持。
3、数据仓库的组成。源数据-->数据准备区-->数据仓库(维度建模)-->
数据聚集区(OLAP)-->展现。其中原系统到数据准备区属于 ETL 过程。数据仓
库和数据聚集区本书称为数据展示。展现本书称为数据存取工具。
4、数据仓库应特别注意的几点特点:(1)、数据应该以维度的形式进行展
示、存储和访问。(2)、数据仓库中必须包含详细的原子数据。(3)、必须采
用共同的维度和事实表来建模。
5、数据仓库采用使用维度建模的好处:易理解、查询的高性能、修改的灵
活性和可扩充性。
6、维度建模的扩展性。表现在三个方面:(1)、在现有的事实表中增加维
度。(2)、在事实表中增加事实。(3)、在维度表中增加属性。(第一章)
7、维度模型设计的四个步骤。(1)、选取业务(主题)。(2)、定于业
务处理的粒度。(3)、选择维度。(4)、选择事实。
8、应优先为模型选择有原子性的信息,因为原子性的数据提供了最大限度
的灵活性,可以接受任何可能形式的约束。(第二章)