下载
第3章 设计数据仓库
建造数据仓库有两个主要方面
—
与操作型系统接口的设计和数据仓库本身的设计。在某
种程度上来说,“设计”并不能精确描述在启发式方式下建造数据仓库时发生了什么。首先,
载入一部分数据,供 D S S 分析员使用和查看。然后,根据最终用户的反馈,在数据仓库中修
改、增添一些数据。
这种反馈循环贯穿于整个数据仓库的开发过程。那种以为在建造数据仓库时,用过去曾
用的设计方法就可以满足需求的想法是错误的。在数据仓库部分载入并且为 D S S 分析员使用
之前,数据仓库的需求是不可能知道的。因此,在设计数据仓库时,不能采用设计传统“需
求-驱动”系统同样的方法。在另一方面,那种认为不预测需求是好思路的想法也是错误的。
在实际中,通常是介于两者之间的。
3.1 从操作型数据开始
起初,现存系统中存储的是操作型数据。这就难免会让人认为建造数据仓库是一个抽取
操作型数据,然后将其输入数据仓库的过程。其他就没有什么要做的了。
图3 - 1简单描绘了从现有的系统环境中抽取出数据加入数据仓库的过程。可以看到有多个
应用程序对数据仓库作出贡献。
图3-1 把数据从操作型环境移入数据仓库不是简单的抽取
认为图3 - 1 过于简单是有多种理由的。认为建造数据仓库仅仅是数据的抽取过程的观点之
所以是错误的,主要是因为操作型环境中的数据是非集成的。图 3 - 2 表明现存系统中缺乏数据
集成是很常见的。
在以前构造现有应用时,没有考虑到将来可能还要集成。每个应用系统都有其独立的、
特殊的需求,而且在开发过程中不曾考虑到其他的应用。因此毫不奇怪,在不同的地方用不
同的名字存放相同的数据;或一些数据在不同的应用中用同一方式标明,但仍然是同样的数
数据仓库
现有应用
评论1
最新资源