HAWQ数据仓库与数据挖掘实战
电子书推荐
-
数据仓库工具箱 维度建模权威指南 第3版_(美)金博尔,(美)罗斯著_北京 评分:
随着TheDataWarehouseToolkit(1996)第1版的出版发行,RalphKimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和实践的资源。 本书汇集了到目前为止最全面的维度建模技术。《大数据应用与技术丛书·数据仓库工具箱(第3版):维度建模指南》采用新的思路和实 践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。 本书涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述。 主要内容 ◆实用设计技术——有关维度和事实表的基本和高级技术 ◆14个案例研究,涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、保险、教育、电信和运输等 ◆为12个案例研究提供了数据仓库总线矩阵示例 ◆需要避免的维度建模陷阱和错误 ◆增强的缓慢变化维度(SCD)技术类型0~类型7 ◆用于处理参差不齐的可变深度层次和多值属性的桥接表 ◆大数据分析的实践 ◆与业务参与方合作、交互设计会议的指南 ◆有关KimballDW/BI项目生命周期方法论的概论 ◆对ETL系统和设计思考的总结 ◆构建维度和事实表的34个ETL子系统和技术 目录 第1章 数据仓库、商业智能及维度建模初步 1.1 数据获取与数据分析的区别 1.2 数据仓库与商业智能的目标 1.3 维度建模简介 1.3.1 星型模式与OLAP多维数据库 1.3.2 用于度量的事实表 1.3.3 用于描述环境的维度表 1.3.4 星型模式中维度与事实的连接 1.4 Kimball的DW/BI架构 1.4.1 操作型源系统 1.4.2 获取.转换_加口载(ETL)系统 1.4.3 用于支持商业智能决策的展现区 1.4.4 商业智能应用 1.4.5 以餐厅为例描述Kimball架构 1.5 其他DW/BI架构 1.5.1 独立数据集市架构] 1.5.2 辐射状企业信息工厂Inmon架构 1.5.3 混合辐射状架构与Kimball架构 1.6 维度建模神话 1.6.1 神话1:维度模型仅包含汇总数据 1.6.2 神话2:维度模型是部门级而不是企业级的 1.6.3 神话3:维度模型是不可扩展的 1.6.4 神话4:维度模型仅用于预测 1.6.5 神话5:维度模型不能被集成 1.7 考虑使用维度模型的 更多理由 1.8 本章小结 第2章 Kimball维度建模技术概述 2.1 基本概念 2.1.1 收集业务需求与数据实现 2.1.2 协作维度建模研讨 2.1.3 4步骤维度设计过程 2.1.4 业务过程 2.1.5 粒度 2.1.6 描述环境的维度 2.1.7 用于度量的事实 2.1.8 星型模式与OLAP多维数据库 2.1.9 方便地扩展到维度模型 2.2 事实表技术基础 2.2.1 事实表结构 2.2.2 可加、半可加、不可加事实 2.2.3 事实表中的空值 2.2.4 一致性事实 2.2.5 事务事实表 2.2.6 周期快照事实表 2.2.7 累积快照事实表 2.2.8 无事实的事实表 2.2.9 聚集事实表或OLAP多维数据库 2.2.1 0合并事实表 2.3 维度表技术基础 2.3.1 维度表结构 2.3.2 维度代理键 2.3.3 自然键、持久键和超自然键 2.3.4 下钻 2.3.5 退化维度 2.3.6 非规范化扁平维度 2.3.7 多层次维度 2.3.8 文档属性的标识与指示器 2.3.9 维度表中的空值属性 2.3.10 日历日期维度 2.3.11 扮演角色的维度 2.3.12 杂项维度 2.3.13 雪花维度 2.3.14 支架维度 2.4 使用一致性维度集成 2.4.1 一致性维度 2.4.2 缩减维度 2.4.3 跨表钻取 2.4.4 价值链 2.4.5 企业数据仓库总线架构 2.4.6 企业数据仓库总线矩阵 2.4.7 总线矩阵实现细节 2.4.8 机会/利益相关方矩阵 2.5 处理缓慢变化维度属性 2.5.1 类型0:原样保留 2.5.2 类型1:重写 2.5.3 类型2:增加新行 2.5.4 类型3:增加新属性 2.5.5 类型4:增加微型维度 2.5.6 类型5:增加微型维度及类型1支架 2.5.7 类型6:增加类型1属性到类型2维度 2.5.8 类型7:双类型l和类型2维度 2.6 处理维度层次关系 2.6.1 固定深度位置的层次 2.6.2 轻微参差不齐/可变深度层次 2.6.3 具有层次桥接表的参差不齐/可变深度层次 2.6.4 具有路径字符属性的可变深度层次 2.7 高级事实表技术 2.7.1 事实表代理键 2.7.2 蜈蚣事实表 2.7.3 属性或事实的数字值 2.7.4 日志/持续时间事实 2.7.5 头/行事实表 2.7.6 分配的事实 2.7.7 利用分配建立利润与损失事实表 2.7.8 多种货币事实 2.7.9 多种度量事实单位 2.7.1 0年.日事实 2.7.1 1多遍SQL以避免事实表间的连接 2.7.1 2针对事实表的时间跟踪1 2.7.1 3迟到的事实 2.8 高级维度技术 2.8.1 维度表连接 2.8.2 多值维度与桥接表 2.8.3 随时间变化的多值桥接表 2.8.4 标签的时间序列行为 2.8.5 行为研究分组 2.8.6 聚集事实作为维度属性 2.8.7 动态值范围 2.8.8 文本注释维度 2.8.9 多时区 2.8.10 度量类型维度 …… 第3章 零售业务 第4章 库存 第5章 采购 第6章 订单管理 第7章 会计 第8章 客户关系管理 第9章 人力资源管理 第10章 金融服务 第11章 电信 第12章 交通运输 第13章 教育 第14章 医疗卫生 第15章 电子商务 第16章 保险业务 第17章 KimballDW/BI生命周期概述 第18章 维度建模过程与任务 第19章 ETL子系统与技术 第20章 ETL系统设计与开发过程和任务 第21章 大数据分析
上传时间:2018-04 大小:90.28MB
- 96.61MB
数据建模视频5节100分钟详细讲解
2018-12-06数据建模视频5节100分钟详细讲解,里面想起介绍数仓的三种模型,还有事实表和维度表等建模知识。
- 49B
数据仓库建模 Powerdesigner 维度建模 软件分析 建模 视频教程
2017-12-15数据仓库建模 Powerdesigner 维度建模 软件分析 建模 视频教程
- 244KB
Origin绘制相关性热图插件(Correlation Plot)
2023-09-12Origin绘制相关性热图插件(Correlation Plot),可以绘制相关性热图,不需要代码,格式为opx后缀格式,直接拖入软件就可以~
- 31KB
(免费)Chrome浏览器插件axure-chrome-extension
2023-11-16安装方法详见: https://blog.csdn.net/han_qiqi/article/details/134435059?spm=1001.2014.3001.5501 Axure RP Extension for Chrome是原型设计工具Axure RP的Chrome浏览器插件。因为在线安装需要访问Google Chrome在线商店,访问不了。所以提供一个离线版本进行安装。
- 8.15MB
vep视频快速加密提取器
2023-07-13vep视频快速加密提取器
- 23KB
noc指导教师资格认证题库
2023-12-27都是自己在考试做题的时候记录下来的,答案也是自己查找核对过的 80道题左右,已转化为电子版 仅供各位老师们参考,码字不易,谢谢支持
- 6.92MB
2011-2022年北大数字普惠金融指数数据(包括省市县).zip
2024-01-222011-2022年北大数字普惠金融指数“第五期”(包括省市县) 1、时间:2011-2022年 其中县级的时间为2014-2022年 2、来源:北京大学数字普惠金融指数 3、范围:全国31省,337个地级市以及2800个县 4、指标:覆盖广度、使用深度、支付业务、保险业务、货币基金业务、投资业务、信用业务、信贷业务、数字化程度 这套指数包括数字普惠金融指数,以及数字金融覆盖广度、数字金融使用深度以及普惠金融数字化程度;此外使用深度指数中还包含支付、信贷、保险、信用、投资、货币基金等业务分类指数;但由于监管和公司数据安全审核等方面的原因,2019-2022年的信用和货币基金分指数,没有对外公布。 5、参考文献:郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征
- 35.15MB
最新版YS9082HC主控开卡工具 YS9082HC-MPToolV8.00.00.18.826-HCS1A25E2023062
2023-07-08最新版YS9082HC主控开卡工具 YS9082HC-MPToolV8.00.00.18.826-HCS1A25E2023062
- 8KB
糖尿病数据集diabetes.csv(免费)
2023-04-23糖尿病数据集diabetes.csv,深度学习可用,学习之用 获取地址:https://gitee.com/xxxstar/diabetes/blob/master/DATA/diabetes.csv#
- 6.84MB
IEEE 802.11be(WiFi7) 协议原文pdf文档
2023-04-27IEEE 802.11be协议 WiFi7协议 WiFi WLAN 协议 无线局域网 最新版WiFi协议 WiFi8 WiFi6 IEEE 802.11ax IEEE 802.11ac IEEE 802.11n IEEE 802.11g IEEE 802.11a IEEE 802.11b IEEE 802.11-1997
- 2KB
Mann -kendall突变检验的MATLAB代码
2023-12-31这个代码对相应路径下的所有的EXCEL表的数据都做Mann-Kendall检验
- 67.8MB
全国统计用区划代码和城乡划分代码(2023版)
2024-01-02全国统计用区划代码和城乡划分代码(2023版)
- 1.19MB
Axhub Charts Pro V2.1.1.rplib
2023-08-09Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib Axhub Charts Pro V2.1.1.rplib
- 223.89MB
青霉素发酵过程仿真数据
2023-06-13用于LSTM回归
- 8.53MB
运动想象Physics-Informed Attention Temporal Convolutional Network源码
2024-03-06脑机接口(BCI)是一项有可能改变世界的前沿技术。脑电图(EEG)运动图像(MI)信号已被广泛用于许多BCI应用中以协助残疾人控制设备或环境、甚至增强人的能力。然而大脑信号解码的有限性能限制了BCI行业的广泛发展。在这篇文章中,我们提出了一个基于注意力的时间卷积网络(ATCNet)用于基于EEG的运动图像分类。该ATCNet模型利用多种技术来提高MI分类的性能,参数数量相对较少。ATCNet采用了科学的机器学习来设计一个特定领域的深度学习模型,具有可解释和可说明的特征,多头自我关注来突出MI-EEG数据中最有价值的特征,时间卷积网络来提取高层次的时间特征,以及基于卷积的滑动特征。颞部卷积网络提取高层次的时间特征,基于卷积的滑动窗口有效地增强了MI-EEG数据。所提出的模型在BCI中的表现优于目前最先进的技术。在IV-2a数据集中,提议的模型优于目前最先进的技术,准确率为85.38%和70.97%。
- 2.44MB
数学建模2022国赛C题省一论文
2022-12-14论文获得了山西省一等奖,主要采用了随机森林算法。大家可以参考,相关代码可以私信我。
- 768KB
EPSON L4263 L4266 L4267 L4268 L4269-ECC打印机清零软件
2023-09-24EPSON L4263 L4266 L4267 L4268 L4269_ECC打印机清零软件
- 74.62MB
生活垃圾数据集YOLO版
2023-09-23生活垃圾数据集YOLO版
- 97.12MB
数据集图片爬取工具image_tool
2022-08-26用于爬取数据集,缩放图片尺寸。
- 78.58MB
免费chatGPT4模拟版下载安装可直接使用
2023-03-17免费版本 chatGPT4,功能一样,玩起来很丝滑。 问题回答超级nice
- 5KB
ESRI-Licensing文件夹,安装arcgispro无法破解登录
2024-01-25## Arcgis pro安装破解后仍旧需要登陆!!! 很多小伙伴在安装arcgispro时,很容易出现各种问题! 以下同学问的最多的也是容易出现的两个bug ## 安装后打开一直是正在初始化 大概率是安装过程有问题特别是检查这一步**【Solutions】和【ArcGIS Pro Intelligent】都选择【此功能及所有子功能将安装在本地硬盘驱动器上】** ## 安装后依旧需要登陆 这说明没有破解成功,这是由于替换文件夹中可能缺少几个关键文件,特别很多同学遇到的文件夹缺失中大部分都是**ESRI_Licensing文件夹中缺少几个关键文件内容**!正常的ESRI_Licensing文件夹应该是图三那样的!可以对比检查一下是否缺失
- 294.9MB
SQLServer2017安装包下载
2023-06-12MS SQL Server是Microsoft开发的关系数据库管理系统(RDBMS)。 本产品专为存储其他应用程序所需的检索数据的基本功能而构建。 它可以在同一台计算机上运行,也可以在网络上运行。
- 91KB
泰坦尼克号生存预测数据集
2023-02-09https://www.bilibili.com/video/BV1nt411r7tj 该视频所需的数据集
- 4.91MB
WinHex免安装版可用
2022-05-12包含Windows32和Windows64位
- 4KB
调频连续波(FMCW)雷达二维FFT代码matlab
2023-09-25给出了二维FFT的详细仿真,雷达测速测距的注解
- 7KB
用于本项目中数据爬取部分获取数据
2022-05-26用于本项目中数据爬取部分获取数据
- 37.80MB
《数学物理方法》梁昆淼 第五板答案
2023-05-04最近在做题的过程中遇到了很多问题,网上也没找到对应的习题解答,最后买了电子板的 我看其他人上传的,都是第四版的,希望可以帮助大家
- 80KB
solomn-data
2023-02-08solomn数据集是一个比较经典的用于研究VRP相关问题的数据集,其中 https://www.sintef.no/projectweb/top/vrptw/solomon-benchmark/ 给出了关于数据集的基本介绍
- 9.87MB
图像处理常用的Kodak24数据集 免积分下载
2021-01-14图像处理常用的Kodak24数据集,很多地方下载这个都要积分,一个开源数据集,真的这些人好烦。0积分大家拿去。