数据仓库-3-数据仓库的基本结构.pdf
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2015/6/3 1 第三章 数据仓库的基本结构 Data Warehouse 2015/6/3 2 一个完整的数据仓库的体系结构一般由三个层次 组成,它们是: 1) 数据源(Data Source) 2) 数据仓库(Data Warehouse) 3) 数据集市(Data Mart) 三者之间通过数据仓库管理软件联系起来构成一个 完整的数据体系。 3 数据仓库的基本结构 Data Warehouse 2015/6/3 3 数 据 仓 库 管 理 软 件 ORACLE SYBASE SQL Server 文 件 …… 数据集市 数据集市 数据集市 建 模 数据仓库 元数据管理 抽 取 …… 数据仓库系统示意图 3 数据仓库的基本结构 Data Warehouse 2015/6/3 4 多数据源 数据仓库的数据来源于多个数据源。 不同格式的数据:由于企业在长期事务处理过程中随数据库管 理系统本身发展,形成了企业内从简单到复杂、从小型到大型 的各种,其中有大型关系数据库、对象数据库、桌面数据库、 各种非格式化的数据文件等。 不同的数据操作平台:多种关系数据库操作平台 不同的物理位置 数据源 数据仓库是信息系统的重要组成部分,主要用于支持企业的决策分析。它的基本结构通常由三个层次构成:数据源、数据仓库和数据集市。这些组件通过数据仓库管理软件紧密相连,共同构成了一个完整的数据体系。 数据源(Data Source)是数据仓库获取信息的起点,它可以包括来自多个来源的数据,如大型关系数据库、对象数据库、桌面数据库、非格式化的数据文件等。这些数据源可能位于不同的物理位置,使用不同的数据操作平台,如Oracle、Sybase、SQL Server等。值得注意的是,数据源可能是递归的,也就是说,一个数据仓库的数据源可能来自于另一个数据仓库或在线分析处理(OLAP)服务器。 数据的抽取(Extraction)是数据进入仓库的关键步骤,它涉及将数据从事务处理系统、外部数据源或离线存储导入到数据仓库的过程。在这一阶段,数据需要经过一系列转换,如重建关键字、数据清理、格式转换、文件合并、添加默认值、数据汇总以及重命名操作的跟踪。这个过程通常由专门的ETL(Extraction/Transformation/Loading)工具和清洗工具完成,确保数据的质量和一致性。 数据仓库(Data Warehouse)是存储和管理这些经过处理的数据的地方。它采用不同于传统数据库的组织方式,通常包含早期细节数据、当前细节数据、轻度综合数据、高度综合数据和元数据。早期细节数据保存历史详情,当前细节数据反映最新业务状态,轻度综合数据是对当前数据的初步汇总,高度综合数据则是更高级别的聚合数据,元数据则记录关于数据仓库自身的信息,如数据来源、处理方法等。为了有效管理这些数据,数据仓库通常使用改造过的关系数据库系统,支持多介质管理、多接口实现和数据并行处理,同时关闭事务完整性等不适用于分析的特性。 数据集市(Data Mart)是数据仓库的子集,专注于特定部门或业务领域的数据。它们通常包含轻度综合数据,便于特定用户群快速访问和分析。数据集市的构建可以减轻数据仓库的负担,提高查询效率。 数据仓库系统是一个复杂的架构,旨在整合企业内外部的多源异构数据,通过预处理和存储优化,为决策支持提供高效、准确的信息。理解这个基本结构有助于设计和实施适合企业需求的数据仓库解决方案,以驱动更好的业务洞察和决策。
剩余48页未读,继续阅读
- 粉丝: 192
- 资源: 3万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助