数据仓库与数据挖掘教程(第 2 版)课后习题答案第五章
第五章作业
1.数据仓库的两类用户有什么本质的不同?P96
数据仓库的用户有两类:信息使用者和探索者。
信息使用者是使用数据仓库的大量用户,信息使用者以一种可以
预测的、重复性的方式使用数据仓库平台。探索者完全不同于信息使
用者,他们有一个完全不可预测的、非重复性的数据使用模式。
2.数据仓库的信息使用者与数据库的信息使用者有什么不同?
数据库的信息使用者主要关心当前某一个时间段内的数据,而数
据仓库的信息使用者关心企业从过去某一时点 (如开始应用数据仓库的
时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历
程和未来趋势做出定量分析和预测。
3.
1 非规格化
规范化的作用是产生一种完全没有数据冗余的设计方法。
但是,有时在数据仓库设计中引入一些有限的数据冗余来提高数
据访问效果。
2 创建数据阵列
创建数据阵列,将相关类型的数据(如:1 月、2 月、3 月等月份中
的数据)存储在一起,提高访问效果。
3 预连接表格
一个公用键和共同使用的数据将表格合并在一起。
共享一个公用键,可以将多个表格合并到一个物理表格中。这样
做可以很大程度的提高数据访问效率。
4 预聚集数据
根据“滚动概括”结构来组织数据。
当数据被输入到数据仓库中时,以每小时为基础存储数据。在这
一天结束时,以每天为基础存储累加每小时的数据。在一周结束时,
以每周为基础存储累加每天的数据。月末时,则以每月为基础存储累
评论0
最新资源