没有合适的资源?快使用搜索试试~ 我知道了~
MySQL数据仓库指南.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 114 浏览量
2024-04-05
16:58:11
上传
评论
收藏 448KB DOCX 举报
温馨提示
试读
157页
MySQL数据仓库指南.docx
资源推荐
资源详情
资源评论
MySQL 数据仓库指南
前言
欢迎使用 mysql 多维数据仓库指南。
数据仓库可以通过集成各种多样的数据实现信息的统一,这些数据来源包括
现行的事务操作和管理信息系统,以及外部各种信息源。这些源数据将被整合,
清洗,转换,如果需要直接从这些数据来源读取数据的话,该数据将会在数据仓
库中以更有利于操作的方式存储。
数据仓库的数据构造方式使你可以存储当前和历史的数据。当前数据是实际
事务操作活动必要的,一般是定期的硬拷贝(比如打印出的报表)或者是联机报
表。而历史数据,往往不是那么容易利用,可以提供基于时间点分析的商业信息,
比如:追踪、推论分析,以及对比,这些对于长期计划和战略性的市场决策都是
很重要的。
如 何从多个信息源整合信息,定期积聚存储,有效的需求设计和发展技术,
所有这些都和事务型管理信息系统所应用的技术有很大的不同。本书都是关于数
据仓库的设 计和开发技术,它涵盖了大部分建立数据仓库所涉及到的大部分技
术问题。更为重要的是,本书提供了一个易懂的操作指南,便于开发一个实际的
数据仓库。
本书的适用范围
mysql
多维数据仓库指南
是一个实战的书籍。你将使用 mysql 数据库,但该
书不是关于 mysql 的。本书不涉及任何硬件架构方面的问题。
本书主要关心数据仓库的设计和开发技术。它不涉及开发项目的管理,理
论,以及如何领导开发等相关的技术问题。
本书用一个数据仓库开发的例子来展示技术如何应用。提供数据模型和 sql
脚本,将能够适用于实际的数据仓库开发。这些脚本已经在 Windows xp
professional sp2 平台上用 mysql 5。0。21 版本测试通过。
另外,本书不再对以下的几个主题进行特别的论述:
� 数据仓库的概念
� Sql
� MySQL 数据库
适合阅读本书的人:
数据仓库应用于各种组织和商业机构,从政府部门,非盈利组织到学校,从
制造业到零售店,从金融机构到医疗机构,从传统公司到互联网商家。
本书首先面向数据仓库开发人员。但是,it 经理和其他 it 职业,特别是那
些对 mis(经营报告)和 dss(决策支撑应用)感兴趣的人将发现本书同样有用。
总的说来,本书是给那些为分析应用准备数据工作相关的人,以及那些需要递交
信息的人,比如打印报表,联机报表。
本书同样适用于那些数据仓库初学者。它将直接快速的为那些正在准备开发
他们第一个数据仓库的人提供帮助。
教师和学生可以将该书作为教科书,以便于明确他们对于数据仓库原理,概
念的理解。大部分章节可以被定制用于实验练习。
预备的技能
本书不是面向 it 新人,为了更有效的利用本书,读者必须有一些系统开发
经验。但是,不要求先有数据仓库的建设经验。
需要实践操作本书例子的人需要有 rdbms(关系数据库管理系统)和 sql 的
实际操作技能。
你可以从本书得到
你将可以仅仅用一个示例,一个最先存储商业销售相关数据的数据仓库,并
且进行实践操作,就可以磨练你的数据仓库知识和实际技能。该示例是一个精简
版的实际数据仓库,可以在很多种商业类型中找到它的原型。
你将基于 mysql 数据库用本书介绍的技术一步步的开发该示例中销售相关数
据仓库。这些技术是在通常数据仓库开发中将碰到的问题的分解技巧。通过完成
本文的学习并且完成所有的练习,你将获得相关工作经验并可以为负责第一个实
际数据仓库项目做好准备。
章节总览
本书包含 25 个章节和一个附录。所有章节组织为四个部分。第一部分涵盖
数据仓库基础。第二部分描述从原始数据到数据仓库的迁移。第三部分讨论如何
控制数据仓库的发展演化。第四部分涉及到一些高级的多维技术。接下来的部分
将给出每个章节的预览。
第一篇 基本原理
第一篇,涵盖多维数据仓库的基础原理,有四个章节。
第 1 章,“基本组成”,介绍星型模式(一种数据库模式,有一个事实表,周围
围绕着多个维表)以及解释该模式的基本组成。
第 2 章,”维度历史“ 介绍用代理健来维护维成员的历史记录。
第 3 章,“度量可加性”,包含维度数据仓库中最重要的特性之一,也就是存储
在数据仓库事实表中的度量的可加性。
第 4 章,“维度查询”,介绍最适合应用于星型模式的一种 sql 查询,维度查询
可以用来证明一个维度数据仓库是否具备两个最基本的设计指标:简单和高效。
第二篇: 提取、转换和加载
该篇的所有 5 个章节涉及了数据集成,事实表,维表。
第 5 章,“源数据提取”介绍了不同类型数据的提取。
第 6 章“导入时间维”涵盖了三种最通用的加载时间维的技术。
第 7 章 “初始化导入“和第 8 章,“定期导入”涉及到两种类型的导入技术,
初始化和周期性。
第 9 章,“周期导入计划”,作为第二篇的总结,提供一个进阶式的指导,关于
如何利用 Windows 的任务管理器实现定期导入计划。
第三篇:成长
第三篇介绍了不同的处理技术,这些技术主要处理一个成功的多维数据仓库
成长过程中碰到的相关问题。该部分有十个章节。
第 10 章,“增加字段”讨论关于向现有数据仓库中的表增加一个字段的技
术问题。
第 11 章,“按需载入”涉及按需载入的技术。
第 12 章,“维表子集”,介绍相关技术以帮助用户处理维表子集问题。
第 13 章,“维度角色扮演”,关于在一个事实表中多次使用同一个维度的
问题。
第 14 章,“快照”让你在需要作出汇总数据的时候,能提供快速性能的查
询。
第 15 章,“唯度层次”和第 16 章“多路径和不齐整的维度层次”是关于简
单和多路径维度技术,相应的,这些技术帮助人们进行汇聚和钻取分析。
第 17 章,“维度退化”,展示了如何用维度退化技术去减少一个数据仓库
模式的复杂性。
第 18 章,“垃圾维”,是关于垃圾维的技术,即将表面上不相关的但是经
常会被用户进行要求分析的数据,用维的方式组织起来。
第 19 章,“多星型模式”展示了如何在模式中增加多个星型模式。
第四篇:高级技术
包含六个章节。
第 20 章,“不齐整数据源”,介绍如何在数据仓库中处理那些结构无法直
接映射到目标表的数据源。
第 21 章,“无事实的事实表”,帮助你为客户建立一种可供分析的辅助数
据,一种无事实字段的事实表,该数据无法从数据源直接取得度量。
第 22 章,“迟来的事实”,包含一个技术,用于处理当数据源中某个特殊
的事实没有在计划载入时间之前产生的情况。
第 23 章,“外部数据源和维度合并“,包括两个主题:处理外部数据源和
如何将多个维中分散的属性合并到一个维的技术。
第 24 章,“累积度量”,讨论两个相关的问题:计算度量和累积度量的不
可相加性。
第 25 章,“分段维度”,阐述一种技术,可以帮助使用者针对那些有连续
值的属性进行数据分析。
附录
附录 a,“格式文件数据源”,介绍如何使用本书例子中的格式文件数据源。
源代码下载
可以从 http://jtute.com.上面下载本书的示例的程序脚本。
=====================================================================
=========
Dimensional Data Warehousing with MySQL: A Tutorial
byDjoni Darmawikarta
Brainy Software Corp. 2007 (432 pages)
ISBN:9780975212820
Computer programmers who need to build a data warehouse will find relevant
examples and information written in a thorough, easy-to-follow style in
this step-by-step tutorial.
封底 Back Cover
将 Mysql 这个最流行的开源数据库软件进行数据仓库应用,在本书之前还从
来没有被在创建多维数据仓库方面用这种入门指南的方式进行介绍。主题包括
星型模式建模,数据载入(数据的提取、转换和加载:etl),测试检验,以及
多维查询。本书由始至终应用一个可实践,相对精简的真实的项目。其全面,易
于接受的写作形式使得那些需要建立数据仓库的程序员可以得到相关的示例和
资料。
关于作者
Djoni Darmawikarta 曾就职于 ibm,现在是一个加拿大保险公司的数据仓库、商
业智能团队中的技术专家。目前生活在 Toronto, Ontario。
剩余156页未读,继续阅读
资源评论
ohmygodvv
- 粉丝: 506
- 资源: 2348
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功