. . . .
第二周:2012/9/4
第三讲:数据仓库的多维数据模型
数据仓库多维数据模型〔Multi-Dimensional Data Model〕是为了满足用户从多角度多
层次进展数据查询和分析的需要而建立起来的基于事实和维的数据库模型,其根本的应用
是为了实现 OLAP〔Online Analytical Processing〕。
1.度量值〔Measure〕
度量值是决策者所关心的具有实际意义的数值。例如,销售量、库存量、银行贷款金
额等。度量值是所分析的多维数据集的核心,它是最终用户浏览多维数据集时重点查看的
数值数据。
2. 事实数据表〔Fact Table〕
度量值所在的表称为事实数据表,事实数据表中存放的事实数据通常包含大量的数据
行。事实数据表的主要特点是包含数值数据〔事实〕,而这些数值数据可以统计汇总以提
供有关单位运作历史的信息。
3.维度成员〔Dimension Member〕
维的一个取值称为该维的一个维度成员〔简称维成员〕。如果一个维是多级别的,那
么该维的维度成员是在不同维级别的取值的组合。例如,考虑时间维具有日、月、年这 3
个级别,分别在日、月、年上各取一个值组合起来,就得到了时间维的一个维成员,即“某
年某月某日〞。
4. 维度表〔Dimension Table〕
包含维度信息的表是维度表,维度表包含描述事实数据表中的事实记录的特性。
维度表和事实
表相互独立,又互
相关联并构成一个
统一的模式。构建
多维数据集时常用
的架构:
1. 星型模式
星型模式是一
种多维的数据关系,
它 由 一 个 事 实 表
(Fact Table)和一组
维表(Dimens ion Table)组成。每个维表都有一个维作为主键,所有这些维的主键组合成事
实表的主键。事实表的非主键属性称为事实 (Fact),它们一般都是数值或其他可以进展计算
的数据; 而维表大都是文字、时间等类型的数据,按这种方式组织好数据我们就可以按照不
同的维(事实表的主键的局部或全部 ) 来对这些事实数据进展求和 (summary) 、求平均
(average)、计数(count)、百分比(percent)的聚集计算,甚至可以做 20-80 分析。这样就可以
从不同的角度数字来分析业务主题的情况
1 / 5