没有合适的资源?快使用搜索试试~ 我知道了~
数据仓库与数据挖掘期末综合复习.doc
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 36 浏览量
2022-07-14
12:22:01
上传
评论
收藏 54KB DOC 举报
温馨提示
![preview](https://dl-preview.csdnimg.cn/86157996/0001-03e197d0dccb23cc565fb5506d6fa78e_thumbnail-wide.jpeg)
![preview-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/scale.ab9e0183.png)
试读
15页
数据仓库与数据挖掘期末综合复习.doc
资源推荐
资源详情
资源评论
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![](https://csdnimg.cn/release/download_crawler_static/86157996/bg1.jpg)
第 1 页
数据仓库及数据挖掘期末综合复习
第一章
1、数据仓库就是一个面向主题的、集成的、相对稳定的、反映
历史变化的数据集合。
2、元数据是描述数据仓库内数据的结构和建立方法的数据,它
为访问数据仓库提供了一个信息目录,根据数据用途的不同可将
数据仓库的元数据分为技术元数据和业务元数据两类。
3、数据处理通常分成两大类:联机事务处理和联机分析处理。
4、多维分析是指以“维”形式组织起来的数据(多维数据集)
采取切片、切块、钻取和旋转等各种分析动作,以求剖析数据,
使拥护能从不同角度、不同侧面观察数据仓库中的数据,从而深
入理解多维数据集中的信息。
5、ROLAP 是基于关系数据库的 OLAP 实现,而 MOLAP 是基于多维
数据结构组织的 OLAP 实现。
OLAP 技术的有关概念 :
OLAP 根据其存储数据的方式可分为三类:ROLAP、MOLAP、HOLAP
6、数据仓库按照其开发过程,其关键环节包括数据抽取、数据
存储及管理和数据表现等。
7、数据仓库系统的体系结构根据应用需求的不同,可以分为以
下 4 种类型:两层架构、独立型数据集合、以来型数据结合和操
作型数据存储和逻辑型数据集中和实时数据仓库。
8、操作型数据存储实际上是一个集成的、面向主题的、可更新
的、当前值的(但是可“挥发”的)、企业级的、详细的数据库,
也叫运营数据存储。
9、“实时数据仓库”以为着源数据系统、决策支持服务和仓库
仓库之间以一个接近实时的速度交换数据和业务规则。
10、从应用的角度看,数据仓库的发展演变可以归纳为 5 个阶段:
以报表为主、以分析为主、以预测模型为主、以运营导向为主和
以实时数据仓库和自动决策为主。
11、什么是数据仓库?数据仓库的特点主要有哪些?
数据仓库通常是指一个数据库环境,而不是支一件产品,它是提
供用户用于决策支持的当前和历史数据,这些数据在传统的数据
库中通常不方便得到。数据仓库就是一个面向主题的(Subject
Oriented)、集成的(Integrate)、相对稳定的
![](https://csdnimg.cn/release/download_crawler_static/86157996/bg2.jpg)
第 2 页
(Non-Volatile)、反映历史变化(Time Variant)的数据集合,
通常用于辅助决策支持。
数据仓库的特点包含以下几个方面:
(1)面向主题。操作型数据库的数据组织是面向事务处理任务,
各个业务系统之间各自分离;而数据仓库中的数据是按照一定的
主题域进行组织。
(2)集成的。面向事务处理的操作型数据库通常及某些特定的
应用相关,数据库之间相互独立,并且往往是异构的。也就是说
存放在数据仓库中的数据应使用一致的命名规则、格式、编码结
构和相关特性来定义。
(3)相对稳定的。操作型数据库中的数据通常实时更新,数据
根据需要和时发生变化。数据仓库的数据主要供单位决策分析之
用,对所涉和的数据操作主要是数据查询和加载,一旦某个数据
加载到数据仓库以后,一般情况下将作为数据档案长期保存,几
乎不再做修改和删除操作,也就是说针对数据仓库,通常有大量
的查询操作和少量定期的加载(或刷新)操作。
(4)反映历史变化。操作型数据库(OLTP)主要关心当前某一
个时间段内的数据,而数据仓库中的数据通常包含较久远的历史
数据,因此总是包括一个时间维,以便可以研究趋势和变化。数
据仓库系统通常记录了一个单位从过去某一时点(如开始启用数
据仓库系统的时点)到目前的所有时期的信息,通过这些信息,
可以对单位的发展历程和未来趋势做出定量分析和预测。
12、数据挖掘的概念
数据挖掘,就是从大量数据中获取有效的、新颖的、潜在有用的、
最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大
量数据中提取或“挖掘”知识,又被称为数据库中的知识发现。
数据挖掘的方法:直接数据挖掘、间接数据挖掘。
13、数据仓库及数据挖掘的关系
若将数据仓库比作矿井,那么数据挖掘就是深入矿井采矿的工作;
数据挖掘是从数据仓库中找出有用信息的一种过程及技术。
14、数据仓库系统的体系结构的分类
(1)两层架构(Generic Two-Level Architecture)。
(2)独立型数据集市(Independent Data Mart)。
(3)依赖型数据集市和操作型数据存储(Dependent Data Mart
and Operational Data Store)。
![](https://csdnimg.cn/release/download_crawler_static/86157996/bg3.jpg)
第 3 页
(4)逻辑型数据集市和实时数据仓库(Logical Data Mart and
Real-Time Data Warehouse)。
15、数据仓库的未来
(1)在数据抽取方面,未来的技术发展将集中在系统集成化方
面。它将互连、转换、复制、调度、监控纳入标准化的统一管理,
以适应数据仓库本身或数据源可能的变化,使系统更便于管理和
维护。
(2)在数据管理方面,未来的发展将使数据库厂商明确推出数
据仓库引擎,作为数据仓库服务器产品及数据库服务器并驾齐驱。
在这一方面,带有决策支持扩展的并行关系数据库将最具发展潜
力。
(3)在数据表现方面,数理统计的算法和功能将普遍集成到联
机分析产品中,并及 Internet/Web 技术紧密结合。按行业应用
特征细化的数据仓库用户前端软件将成为产品作为数据仓库解
决方案的一部分。数据仓库实现过程的方法论将更加普和,将成
为数据库设计的一个明确分支,成为管理信息系统设计的必备
16、请列出 3 种数据仓库产品,并说明其优缺点。
(1)IBM 公司提供了一套基于可视化数据仓库的商业智能(BI)
解决方案,包括:Visual Warehouse(VW),Essbase/DB2 OLAP
Server 5.0、IBM DB2 UDB,以和来自第三方的前端数据展现工具
(如 BO)和数据挖掘工具(如 SAS)。其中,VW 是一个功能很
强的集成环境,既可用于数据仓库建模和元数据管理,又可用于
数据抽取、转换、装载和调度。Essbase/DB2 OLAP Server 支持
“维”的定义和数据装载。Essbase/DB2 OLAP Server 不是 ROLAP
(Relational OLAP)服务器,而是一个(ROLAP 和 MOLAP)混合
的 HOLAP 服务器,在 Essbase 完成数据装载后,数据存放在系统
指定的 DB2 UDB 数据库中。它的前端数据展现工具可以选择
Business Objects 的 BO、Lotus 的 Approach、Cognos 的
Impromptu 或 IBM 的 Query Management Facility;多维分析工
具支持 Arbor Software 的 Essbase 和 IBM(及 Arbor 联合开发)
的 DB2 OLAP 服务器;统计分析工具采用 SAS 系统。
(2)Oracle 数据仓库解决方案主要包括 Oracle Express 和
Oracle Discoverer 两个部分。Oracle Express 由四个工具组成:
Oracle Express Server 是一个 MOLAP(多维 OLAP)服务器,它利
用多维模型,存储和管理多维数据库或多维高速缓存,同时也能
剩余14页未读,继续阅读
资源评论
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/default.jpg!1)
kfcel5889
- 粉丝: 3
- 资源: 5万+
![benefits](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-1.c8e153b4.png)
下载权益
![privilege](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-2.ec46750a.png)
C知道特权
![article](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-3.fc5e5fb6.png)
VIP文章
![course-privilege](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-4.320a6894.png)
课程特权
![rights](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-icon.fe0226a8.png)
开通VIP
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)