HAWQ数据仓库与数据挖掘实战
电子书推荐
-
数据仓库 (中文第四版)pdf格式 评分:
《Web数据挖掘》旨在讲述这些任务以及它们的核心挖掘算法;尽可能涵盖每个话题的广泛内容,给出足够多的细节,以便读者无须借助额外的阅读,即可获得相对完整的关于算法和技术的知识。其中结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等4章是《Web数据挖掘》的特色,这些内容在已有书籍中没有提及,但它们在Web数据挖掘中却占有非常重要的地位。当然,传统的Web挖掘主题,如搜索、页面爬取和资源探索以及链接分析在书中也作了详细描述。
上传时间:2017-11 大小:11.73MB
- 8.51MB
数据仓库设计-221页.pdf
2021-10-14第1 章决策支持系统的发展 第2 章数据仓库环境 第3 章设计数据仓库 第4 章数据仓库中的粒度 第5 章数据仓库和技术 第6 章分布式数据仓库 第7 章高级管理人员信息系统和数据仓库 第8 章外部数据/非结构化数据与数据仓库 第9 章迁移到体系结构设计环境 第10 章数据仓库的设计复查要目
- 6.65MB
数据仓库第四版
2019-03-15数据仓库第四版
- 8.79MB
数据仓库(原书第4版)
2013-08-30数据仓库(原书第4版)(决战大数据时代!IT技术人员不得不读!)
- 6.65MB
数据仓库 电子书
2009-07-28本书论述在设计和建造数据仓库中涉及的所有主要问题,论述分析型环境(决策支持系统环境)以及在这种环境中的数据构造。主要内容包括数据仓库的设计与建造步骤,传统系统到数据仓库的迁移,数据仓库的数据粒度、数据分割、元数据管理、外部数据与非结构化数据,分布式数据仓库、高级管理人员信息系统和数据仓库的设计评审等。 本书主要是面向数据仓库的设计、开发和管理人员,以及构造和使用现代信息系统的人员,也适于信息处理方面的高校师生和从事传统数据库系统技术工作的人阅读。
- 6.65MB
数据仓库(原书中文第四版)
2012-08-03学习数据仓库的好书,很经典。 目录: 目录 译者序 审、译者简介 前言 第1章 决策支持系统的发展 1 1.1 演化 1 1.2 直接存取存储设备的产生 2 1.3 个人计算机/第四代编程语言技术 3 1.4 进入抽取程序 3 1.5 蜘蛛网 4 1.6 自然演化体系结构的问题 5 1.6.1 数据缺乏可信性 5 1.6.2 生产率问题 8 1.6.3 从数据到信息 10 1.6.4 方法的变迁 11 1.7 体系结构设计环境 12 1.7.1 体系结构设计环境的层次 13 1.7.2 集成 14 1.8 用户是谁 15 1.9 开发生命周期 15 1.10 硬件利用模式 16 1.11 建立重建工程的舞台 16 1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 2.6 样本数据库 34 2.7 数据分割 35 2.8 数据仓库中的数据组织 37 2.9 数据仓库—标准手册 41 2.10 审计和数据仓库 41 2.11 成本合理性 41 2.12 清理仓库数据 42 2.13 报表和体系结构设计环境 42 2.14 机遇性的操作型窗口 43 2.15 小结 44 第3章 设计数据仓库 45 3.1 从操作型数据开始 45 3.2 数据/过程模型和体系结构设计环境 49 3.3 数据仓库和数据模型 50 3.3.1 数据模型 52 3.3.2 中间层数据模型 54 3.3.3 物理数据模型 58 3.4 数据模型和反复开发 59 3.5 规范化/反规范化 60 3.6 数据仓库中的快照 65 3.7 元数据 66 3.8 数据仓库中的管理参照表 66 3.9 数据周期 67 3.10 转换和集成的复杂性 70 3.11 触发数据仓库记录 71 3.11.1 事件 72 3.11.2 快照的构成 72 3.11.3 一些例子 72 3.12 简要记录 73 3.13 管理大量数据 74 3.14 创建多个简要记录 75 3.15 从数据仓库环境到操作型环境 75 3.16 正常处理 75 3.17 数据仓库数据的直接访问 76 3.18 数据仓库数据的间接访问 76 3.18.1 航空公司的佣金计算系统 76 3.18.2 零售个性化系统 78 3.18.3 信用审核 80 3.19 数据仓库数据的间接利用 82 3.20 星型连接 83 3.21 小结 86 第4章 数据仓库中的粒度 87 4.1 粗略估算 87 4.2 粒度划分过程的输入 88 4.3 双重或单一的粒度? 88 4.4 确定粒度的级别 89 4.5 一些反馈循环技巧 90 4.6 粒度的级别—以银行环境为例 90 4.7 小结 95 第5章 数据仓库和技术 96 5.1 管理大量数据 96 5.2 管理多介质 97 5.3 索引/监视数据 97 5.4 多种技术的接口 97 5.5 程序员/设计者对数据存放位置的控制 98 5.6 数据的并行存储/管理 99 5.7 元数据管理 99 5.8 语言接口 99 5.9 数据的高效装入 99 5.10 高效索引的利用 100 5.11 数据压缩 101 5.12 复合键码 101 5.13 变长数据 101 5.14 加锁管理 102 5.15 单独索引处理 102 5.16 快速恢复 102 5.17 其他的技术特征 102 5.18 DBMS类型和数据仓库 102 5.19 改变DBMS技术 104 5.20 多维DBMS和数据仓库 104 5.21 双重粒度级 109 5.22 数据仓库环境中的元数据 109 5.23 上下文和内容 111 5.24 上下文信息的三种类型 111 5.25 捕获和管理上下文信息 113 5.26 刷新数据仓库 113 5.27 小结 114 第6章 分布式数据仓库 116 6.1 引言 116 6.2 局部数据仓库 118 6.3 全局数据仓库 119 6.4 互斥数据 121 6.5 冗余 123 6.6 全局数据存取 124 6.7 分布式环境下其他考虑因素 126 6.8 管理多个开发项目 127 6.9 开发项目的性质 127 6.10 分布式数据仓库 130 6.10.1 在分布的地理位置间协调开发 131 6.10.2 企业数据分布式模型 132 6.10.3 分布式数据仓库中的元数据 134 6.11 在多种层次上建造数据仓库 134 6.12 多个小组建立当前细节级 136 6.12.1 不同层不同需求 138 6.12.2 其他类型的细节数据 140 6.12.3 元数据 142 6.13 公用细节数据采用多种平台 142 6.14 小结 143 第7章 高级管理人员信息系统 和数据仓库 144 7.1 一个简单例子 144 7.2 向下探察分析 146 7.3 支持向下探察处理 147 7.4 作为EIS基础的数据仓库 149 7.5 到哪里取数据 149 7.6 事件映射 152 7.7 细节数据和EIS 153 7.8 在EIS中只保存汇总数据 154 7.9 小结 154 第8章 外部数据/非结构化数据与 数据仓库 155 8.1 数据仓库中的外部数据/非结构化数据 157 8.2 元数据和外部数据 158 8.3 存储外部数据/非结构化数据 159 8.4 外部数据/非结构化数据的不同 组成部分 160 8.5 建模与外部数据/非结构化数据 160 8.6 间接报告 161 8.7 外部数据归档 161 8.8 内部数据与外部数据的比较 161 8.9 小结 162 第9章 迁移到体系结构设计环境 163 9.1 一种迁移方案 163 9.2 反馈循环 167 9.3 策略方面的考虑 168 9.4 方法和迁移 171 9.5 一种数据驱动的开发方法 171 9.6 数据驱动的方法 172 9.7 系统开发生命周期 172 9.8 一个哲学上的考虑 172 9.9 操作型开发/DSS开发 173 9.10 小结 173 第10章 数据仓库的设计复查要目 174 10.1 进行设计复查所涉及的问题 175 10.1.1 谁负责设计复查 175 10.1.2 有哪些议事日程 175 10.1.3 结果 175 10.1.4 复查管理 175 10.1.5 典型的数据仓库设计复查 176 10.2 小结 185 附录 186 技术词汇 215 参考文献 222
- 6.65MB
数据仓库(原书中文第四版).rar
2011-04-21数据仓库(原书中文第四版).rar数据仓库(原书中文第四版).rar数据仓库(原书中文第四版).rar
- 6.65MB
数据仓库原书中文第四版
2013-04-27数据仓库原书中文第四版
- 6.65MB
数据仓库中文第四版
2013-03-10数据仓库中文原书第四版,学习数据仓库入门教材。
- 27KB
数据仓库与数据挖掘课后答案(陈志泊著)清华大学出版社[归类].pdf
2021-10-14数据仓库与数据挖掘课后答案(陈志泊著)清华大学出版社[归类].pdf
- 1.32MB
数据仓库设计
2018-01-29以业务和需求为中心驱动数据仓库的建设和不同模型构建模式
- 116.88MB
数据仓库学习书籍三本
2018-11-27资源中包括了三本权威的数据仓库电子书三本,数据仓库,数据仓库的设计,数据仓库工具想
- 751KB
数据仓库概念汇总.pdf
2017-11-23比较全面的介绍了数据仓库相关的术语和概念等。。。。。。
- 2.29MB
3万字38页《数据仓库知识体系》.pdf
2021-09-15整理了1年!整整38页数据仓库干货!
- 13.79MB
数据仓库与数据挖掘(电子教材)
2010-05-12数据仓库与数据挖掘(电子教材)包括:数据仓库(原书中文第四版)(pdf)、数据挖导论、Data+Mining+Concepts+a95961、韩家伟+数据挖掘.pdf、数理统计基础、数据挖掘入门.pdf这些书。
- 1.90MB
数据仓库_(Inmon).part3
2008-07-22一本学习数据库的好书,大家可以看看
- 4.39MB
数据库系统及应用].崔巍.文字版.pd
2012-06-03数据库的基本概念、数据模型、关系数据库、关系数据库系统、关系数据库标准语言SQL、数据完整性、数据库安全、事务管理、并发控制、数据库恢复...开发、分布式数据库、数据仓库以及数据库技术新的研究领域和应用领域等...
- 3.52MB
完整版 重庆大学 商务智能课程 BI教程 大数据与数据挖掘教程 第5章 数据预处理技术(共114页).ppt
2022-01-16实验\小报告\第四组商务智能报告.doc 实验\小报告\第五组小报告.pdf 实验\小报告\第一组建库报告.pdf 数据\adventureworks数据库DW数据仓库示例.pdf 数据\Bank 数据解释.doc 数据\bank.csv 数据\bank.xls 数据\bank3...
- 4.7MB
数据仓库ETL工具箱(中文版).rar
2017-07-20第四章 清洗和规范化 第五章 提交维度表 第六章 提交事实表 第七章 开发程序 第三部分 开发和运行维护 第八章 运行维护 第九章 元数据 第十章 职责与分工 第十二章 结论 第十一章 实时ETL系统 第四部分 实时流ETL...
- 8.58MB
数据仓库基础(中英文打包下载)1
2008-03-14数据仓库基础(中英文打包下载) 都是pdf格式 重新上传 为3部分 http://download.csdn.net/source/635301 http://download.csdn.net/source/635330 http://download.csdn.net/source/635356
- 7.44MB
数据仓库设计.doc
2019-06-22数据挖掘课程设计,从数据仓库设计到ssas的使用 ,数据挖掘(Data Mining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为数据库中知识发现(Knowledge Discovery in Database, KDD), 也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程以下步骤组成:(1)数据清理,(2)数据集成,(3)数据选择,(4)数据变换,(5)数据挖掘,(6)模式评估,(7)知识表示。数据挖掘可以与用户或知识库交互。
- 8.49MB
数据仓库设计-数据仓库设计
2021-02-14数据仓库设计
- 215KB
数据仓库开发实例.pdf
2019-06-19数据仓库项目的实际分析、过程讲述,对开始进行数据仓库设计有一定帮助
- 182KB
数据仓库规范设计.pdf
2019-11-04数据仓库规范设计.pdf
- 18.73MB
数据库系统导论(第七版)
2012-03-3121.5 数据仓库和数据集市 527 21.6 联机分析处理 530 21.7 数据挖掘 535 21.8 小结 536 练习 537 参考文献和简介 538 部分练习答案 540 第22章 时态数据库 541 22.1 引言 541 22.2 时态数据 542 22.3 问题是什么 544...
- 6.58MB
完整版 重庆大学 商务智能课程 BI教程 大数据与数据挖掘教程 数据库基础知识补充 数据库系统实例分析(共43页).ppt
2022-01-16实验\小报告\第四组商务智能报告.doc 实验\小报告\第五组小报告.pdf 实验\小报告\第一组建库报告.pdf 数据\adventureworks数据库DW数据仓库示例.pdf 数据\Bank 数据解释.doc 数据\bank.csv 数据\bank.xls 数据\bank3...
- 46.88MB
Spring in Action(第二版 中文高清版).part2
2013-03-16第一部分 Spring的核心 第1章 开始Spring之旅 1.1 Spring是什么 1.2 开始Spring之旅 1.3 理解依赖注入 1.3.1 依赖注入 1.3.2 DI应用 1.3.3 企业级应用中的依赖注入 1.4 应用AOP 1.4.1 AOP介绍 1.4.2 AOP...
- 48.0MB
Spring in Action(第二版 中文高清版).part1
2013-03-16第一部分 Spring的核心 第1章 开始Spring之旅 1.1 Spring是什么 1.2 开始Spring之旅 1.3 理解依赖注入 1.3.1 依赖注入 1.3.2 DI应用 1.3.3 企业级应用中的依赖注入 1.4 应用AOP 1.4.1 AOP介绍 1.4.2 AOP...
- 11.73MB
大数据培训 ppt,内容丰富
2022-02-2203第三章Hive分布式数据仓库.pdf 04第四章HBase技术原理,pdf O5第五章MapReduce和YARN技术原理.pdf 06第六章Spak基于内存的分布式计算。pdf 07第七章Flink流批体分布式实时处理引擎pdf 08第八章数据采集与数据装载...