数据仓库与数据挖掘习题答案
第 1 章 数据仓库的概念与体系构造
1. 面向主题的,相对稳定的。
2. 技术元数据,业务元数据。
3. 联机分析处理 OLAP。
4. 切片〔Slice〕,钻取〔Drill-down 和 Roll-up 等〕。
5. 基于关系数据库。
6. 数据抽取,数据存储与管理。
7. 两层架构,独立型数据集市,依赖型数据集市和操作型数据存储,逻辑型数据集市和实
时数据仓库。
8. 可更新的,当前值的。
9. 接近实时。
10. 以报表为主,以分析为主,以预测模型为主,以营运导向为主。
11. 答:
数据仓库就是一个面向主题的〔Subject Oriented〕、集成的〔Integrate〕、相对稳定的
〔Non-Volatile〕、反映历史变化〔Time Variant〕的数据集合,通常用于辅助决策支持。
数据仓库的特点包含以下几个方面:
〔1〕 面向主题。操作型数据库的数据组织是面向事务处理任务,各个业务系统之间各
自别离;而数据仓库中的数据是按照一定的主题域进展组织。主题是一个抽象的概念,是指
用户使用数据仓库进展决策时所关心的重点领域,一个主题通常与多个操作型业务系统或外
部档案数据相关。
〔2〕集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间
相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据作抽取、
清理的根底上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数
据仓库内的信息是关于整个企事业单位一致的全局信息。也就是说存放在数据仓库中的数据
应使用一致的命名规那么、格式、编码构造和相关特性来定义。
〔3〕相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。
数据仓库的数据主要供单位决策分析之用,对所涉及的数据操作主要是数据查询和加载,一
旦某个数据加载到数据仓库以后,一般情况下将作为数据档案长期保存,几乎不再做修改和
删除操作,也就是说针对数据仓库,通常有大量的查询操作及少量定期的加载〔或刷新〕操
作。
〔4〕反映历史变化。操作型数据库〔OLTP〕主要关心当前某一个时间段内的数据,而
数据仓库中的数据通常包含较长远的历史数据,因此总是包括一个时间维,以便可以研究趋
势和变化。数据仓库系统通常记录了一个单位从过去某一时点(如开场启用数据仓库系统的
时点)到目前的所有时期的信息,通过这些信息,可以对单位的开展历程和未来趋势做出定
量分析和预测。
12. 答:
〔1〕两层架构〔Generic Two-Level Architecture〕。
〔2〕独立型数据集市〔Independent Data Mart〕。
〔3〕依赖型数据集市和操作型数据存储〔Dependent Data Mart and Operational Data
Store〕。
〔 4 〕 逻 辑 型 数 据 集 市 和 实 时 数 据 仓 库 〔 Logical Data Mart and Real-Time Data