没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
数据仓库
数据仓库为商务运作提供结构与工具,以便系统地组织、理解和使用数据
进行决策。大量组织机构已经发现,在当今这个充满竞争、快速发展的世界,
数据仓库是一个有价值的工具。在过去的几年中,许多公司已花费数百万美元,
建立企业范围的数据仓库。许多人感到,随着工业竞争的加剧,数据仓库成了
必备的最新营销武器——通过更多地了解客户需求而保住客户的途径。
“那么”,你可能会充满神秘地问,“到底什么是数据仓库?”
数据仓库已被多种方式定义,使得很难严格地定义它。宽松地讲,数据仓
库是一个数据库,它与组织机构的操作数据库分别维护。数据仓库系统允许将
各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处
理提供支持。
按照 W. H. Inmon,一位数据仓库系统构造方面的领头建筑师的说法,“数
据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理决
策制定”。这个简短、全面的定义指出了数据仓库的主要特征。四个关键词,面
向主题的、集成的、时变的、非易失的,将数据仓库与其它数据存储系统(如,
关系数据库系统、事务处理系统、和文件系统)相区别。让我们进一步看看这
些关键特征。
(1)面向主题的:数据仓库围绕一些主题,如顾客、供应商、产品和销售组
织。数据仓库关注决策者的数据建模与分析,而不是构造组织机构的日常操作
和事务处理。因此,数据仓库排除对于决策无用的数据,提供特定主题的简明
视图。
(2)集成的:通常,构造数据仓库是将多个异种数据源,如关系数据库、一
般文件和联机事务处理记录,集成在一起。使用数据清理和数据集成技术,确
保命名约定、编码结构、属性度量的一致性等。
(3)时变的:数据存储从历史的角度(例如,过去 5-10 年)提供信息。数据
仓库中的关键结构,隐式或显式地包含时间元素。
(4)非易失的:数据仓库总是物理地分离存放数据;这些数据源于操作环境
下的应用数据。由于这种分离,数据仓库不需要事务处理、恢复和并行控制机
制。通常,它只需要两种数据访问:数据的初始化装入和数据访问。
概言之,数据仓库是一种语义上一致的数据存储,它充当决策支持数据模
型的物理实现,并存放企业决策所需信息。数据仓库也常常被看作一种体系结
构,通过将异种数据源中的数据集成在一起而构造,支持结构化和启发式查询、
分析报告和决策制定。
“好”,你现在问,“那么,什么是建立数据仓库(data warehousing)?”
根据上面的讨论,我们把建立数据仓库看作构造和使用数据仓库的过程。
数据仓库的构造需要数据集成、数据清理、和数据统一。利用数据仓库常常需
要一些决策支持技术。这使得“知识工人”(例如,经理、分析人员和主管)能
够使用数据仓库,快捷、方便地得到数据的总体视图,根据数据仓库中的信息
做出准确的决策。有些作者使用术语“建立数据仓库”表示构造数据仓库的过程,
而用术语“仓库 DBMS”表示管理和使用数据仓库。我们将不区分二者。
tjqn123456
- 粉丝: 1
- 资源: 4
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页