Ppt 中 60 页的见批注
粒度:数据的不同综合等级.
元数据(meatdata):关于数据的数据.
第一种:从 db 到 db 的转换关系
第二种:与终端用户多维模型/之间建立的 dss 数据.
1.2 粒度
分隔:将数据分散到各自的物理单元中去以便能分别处理.
分片:分隔后的数据
1.3 数据仓库的数据组织方式
简单堆积文件:比如按日堆积
轮转综合文件:比如按日做,但是到达月底时,累计成一个月
简化直接文件:间隔一定时间进行快照
连续文件:
两个连续文件的简化直接文件
一个连续文件+一个堆积文件.
1.4 数据追加
数据仓库的数据初装完成后,再向数据库添加数据.
2.Melta 文件方法
3.前后映象文件
4.日志文件
优点:利用 db 的固有机制,不用扫描整个 db
缺点:
二.数据库体系化环境
名词:再一个企业或者组织内,由各面向应用的 oltpdb/以及面向主题的 db 仓库所组成的完成
的数据环境;
分两个部分:操作性环境/分析型环境.
构成:
Db 与 db 仓库;软硬件资源和人员的配置的明确规定.
层次的体系化环境:
操作型/全局/部门/个人
数据集市.
1. 数据仓库的体系结构.