下载 > 资源分类 >  数据库 >  SQLServer > 数据仓库读书笔记(阐述了DW,MDM,ETL,3NF,维度,事实表,粒度,元数据,移植,安全,数据质量,项目经验)(2/2)

数据仓库读书笔记(阐述了DW,MDM,ETL,3NF,维度,事实表,粒度,元数据,移植,安全,数据质量,项目经验)(2/2)

2013-05-14 上传大小:15.16MB

本资源来源于Jerome's BI BLOG的博客,Jerome's BI Blog关注于:
1、数据仓库架构,丨nmon的企业信息工厂 (CIF),Kimball 总线架构(Bus Architecture)。
2、数据集市(Data Mart),操作数据存储 (ODS),数据准备区(Staging Area),ETL;
3、ER 建模(3NF),维度建模;
4.0LAP 多维数据库,数据挖掘。

博客地址:
http://www.chinabi.net/blog/user1/lastwood/index.html

转载请注明上述出处,感谢Jerome的无私分享。

因格式为pdf,笔者只能手工整理出目录,便于大家浏览:



1 JEROME’S BI BLOG	
1.1简介	
1.2导读	
2数据仓库架构研究	2
2.1浅析数据仓库架构	2
2.2浅析企业信息工厂	3
2.3	浅析多维体系结构	4
2.4浅析操作数据存储	4
2.4.1	Inmon对操作数据存储的定义	5
2.4.2	四类操作数据存储简介	6
2.4.3	第四类操作数据存储的例子	6
2.4.4	DW2.0中的虚拟操作数据存储	7
2.4.5	Kimball对操作数据存储的定义	8
2.4.6	操作数据存储和数据准备区的区别	8
2.4.7	个人对操作数据存储的观点	9
2.5	浅析3NF数据仓库建模	9
2.5.1	3NF数据仓库建模简介	10
2.5.2	3NF数据仓库建模的条件	11
2.5.3	去除操作型数据	11
2.5.4增加时间字段	12
2.5.5	增加派生数据	12
2.5.6建立人工关系	13
2.5.7改变数据的粒度	14
2.5.8对表进行合并处理	15
2.5.9建立重复组	15
2.5.10根据数据稳定性修改数据的存储结构	16
2.6主数据管理:建立企业信息的单一视图	17
2.6.1	MDM 的定义	19
2.6.2	MDM 的内容	20
2.6.3	MDM的业务目的	21
2.6.4	MDM 的案例	22
2.6.5关于MDM的误解	24
2.6.6在传统IT环境中的关于主数据的问题	25
2.6.7建立一个整合的MDM环境	26
2.6.8SOR 和 SOE	27
2.6.9 MDM在IT基础结构中的角色	28
2.6.10整合及管理主数据的技术	28
2.6.11	MDM对传统IT环境的影响	30
2.6.12三类主数据技术的比较	31
2.6.13业务领域MDM和企业MDM的比较	32
2.6.14MDM 的需求	32
2.6.15主数据整合服务	34
2.6.16主数据应用:自己开发、购买还是外包? 	34
2.6.17	MDM面临的挑战	35
2.6.18	MDM面临的其他问题	37
2.6.19	MDM的文化挑战	38
2.6.20	MDM的技术挑战	40
2.6.21	MDM的成功因素	42
2.6.22	总结	42
2.6.23附录A:定义	43
2.6.24 附录 B: MDM 调查	45
3维度建模基本概念	46
3.1数据仓库概念浅析	46
3.2浅析交叉探查	47
3.3浅析退化维度	48
3.4浅析微型维度	48
3.5浅析一致性维度	49
3.6浅析一致性事实	50
3.7浅析总线架构	51
3.8浅析缓慢变化维	51
3.9浅析杂项维度	52
3.10浅析事实表(一)	53
3.11浅析事实表(二)	53
3.12浅析非事实型事实表	54
3.13浅析数据世系	55
3.14浅析多值维度	55
3.15浅析支架维度	56
3.16浅析桥接表	56
3.17浅析审计维度	56
3.18浅析事实维度	57
3.19浅析稀疏事实表	57
3.20浅析操作集市	57
3.21浅析即席查询	57
3.22浅析蜈蚣事实表	58
3.23浅析事务事实表	59
3.24浅析周期快照事实表	59
3.25浅析累积快照事实表	60
3.26浅析原子事实表	61
3.27浅析聚集事实表	61
3.28浅析合并事实表	61 3.29旋转事实表	61
3.30切片事实表	62
3.31浅析因果维度	62
3.32浅析双桶连接	62
3.33浅析角色模仿维度	62
3.34浅析代理关键字	63
3.35自然关键字	64
3.36智能关键字	64
3.37浅析冰山查询	64
3.38浅析预连接聚集表	65
3.39浅析概念数据模型	66
3.40浅析逻辑数据模型	66
3.41浅析物理数据模型	67
3.42浅析聚集建模(一)	67
3.43浅析聚集建模(二)	68
3.44浅析聚集建模(三)	69
3.45浅析聚集建模(四)	69
3.46浅析聚集建模(五)	70
3.47浅析聚集建模(六)	71
3.48浅析聚集建模(七)	72
4 DW2.0	73
4.1DW2.0 导读	73
4.2DW2.0-下一代数据仓库架构(一)	75
4.3	DW2.0-下一代数据仓库架构(二)	76
4.4DW2.0-下一代数据仓库架构(三)	77
4.5	01-交互区(一)	78
4.601-交互区(二)	79
4.7	02-整合区(一)	80
4.8	02-整合区(二)	82
4.9	02-整合区(三)	83
4.10	03-近线区(一)	84
4.11	03-近线区(二)	85
4.1204-归档区(一)	87
4.13	04-归档区(二)	87
4.14关于近线存储器的补充	88
4.15	05-DW2.0 中的 SYSTEM OF RECORD (一)	89
4.16	05-DW2.0 中的 SYSTEM OF RECORD (二)	90
4.17	06-建立0\¥2.0 ( —)	91
4.18	06-建立0\¥2.0 (二)	93
4.19	06-建立0\¥2.0 (三)	94
4.20	06-建立0\¥2.0 (四)	94
4.21	06-建立 DW2.0 (五)	97
4.22	06-建立 DW2.0 (六)	97
4.23	06-建立 DW2.0 (七)	99
4.24	06-建立0\¥2.0 (八)	100
4.25	06-建立 DW2.0 (九)	100
4.26	06-^^; DW2.0 (十)	101
4.27	06-建立0\^2.0 (~\^一) 	102
4.28	06■建立 DW2.0 (十二)	104
4.29	06-建立 DW2.0 (十三)	104
4.30	06-建立 DW2.0 (十四)	105
4.3106-建立0\¥2.0 (十五)	105
4.32	06-建立 DW2.0 (十六)	107
4.33	06-建立 DW2.0 (十七)	109
4.34	06-建立0\¥2.0 (十八)	109
4.35	06■建立 DW2.0 (十九)	111
4.36	06-建立0\¥2.0 (二十)	112
4.37	06-建立 DW2.0 (二^^一) 	112 
4.38	07-DW2.0建立方法学(一)
4.39	07-DW2.0建立方法学(二)
4.40	07-DW2.0建立方法学(三)
4.41	08-模型(一)	
4.4208-模型(二)	
4.43	08-模型(三)	
4.4408-模型(四)	
4.45	08-模型(五)	
4.4608-模型(六)	
4.47	09-从时间价值来考虑数据(一)
4.48	09-从时间价值来考虑数据(二)
4.49	09-从时间价值来考虑数据(三) 4.5009-从时间价值来考虑数据(四)
4.51	09-从时间价值来考虑数据(五)
4.52	10-DW2.0内容的定义(一)
4.53	10-DW2.0内容的定义(二) 4.5410-DW2.0内容的定义(三)
4.55	10-DW2.0内容的定义(四)
4.56	10-DW2.0内容的定义(五) 4.5710-DW2.0内容的定义(六)
4.58	10-DW2.0内容的定义(七)
4.59	10-DW2.0内容的定义(八)
4.60	11-DW2.0 的联通性(一)
4.61	11-DW2.0 的联通性(二)
4.62	11-DW2.0的联通性(三)
4.63	11-DW2.0的联通性(四)
4.64	11-DW2.0的联通性(五)
4.65	12-非结构化数据(一)
4.66	12-非结构化数据(二) 
4.67	13-虚拟操作数据存储(一)	143
4.68	13-虚拟操作数据存储(二)	145
4.69	13-虚拟操作数据存储(三)	146
4.70	13-虚拟操作数据存储(四)	147
4.71	14-探索仓库	148
4.72	15-ETL (一)	149
4.73	15-ETL (二)	151
4.74	16-数据集市	153
4.75	17■粒度管理器	154
4.76	18-元数据(一)	155
4.77	18-元数据(二)	156
4.78	19-全局数据仓库	158
4.7920-从多级存储设备上访问数据(一)	159
4.8020-从多级存储设备上访问数据(二)	160
4.81	21■性能	161
4.82	22-移植(一)	164
4.83	22-移植(二)	166
4.84	22_移植(三)	167
4.8522-移植(四)	168
4.86 23-成本论证	170
5 DW2.0 S 皮书	172
5.1	白皮书目录	172
6项目管理面试题整理	173
6.1	项目管理问题整理	174
6.2	项目需求问题整理	175
6.3	成本论证与预算	175
6.4	组织与职员配备问题整理	176
6.5	用户问题	177 6.6团队问题	178
6.7项目规划与进度安排	180
6.8数据仓库标准	180
6.9工具与供应商	181
6.10	安全	182
6.11数据质量	183
6.12数据整合	184
6.13数据仓库架构	185
6.14 性能	187
7	KIMBALL DESIGN TIPS	187
7.1	Kimball设计技巧导读	187
7.2KDT#1建立点击流数据仓库的一些指导	191
7.3	KDT#1补充点击流数据仓库的粒度选择	192
7.4KDT#2事实表中的多个时间字段	192
7.5KDT#3不要建立部门级的数据集市	193
7.6KDT#4超大维度的变化数据捕获的一种方法	194
7.7KDT#5使用代理键的日期维度	195
7.8 KDT#5补充使用代理键的日期维度	195
7.9KDT#6如何处理关联的维度	196
7.10KDT#7使数据仓库项目步入正轨	196
7.11KDT#8使用类型二的缓慢变化维	197
7.12KDT#9实际处理缓慢变化维时的一个妥协	198
7.13	KDT#11在有缓慢变化维的维度表中统计个数	199
7.14KDT#13可以作为维度表使用的事实表	199
7.15KDT#14事务粒度事实表中某天数据的查询	201
7.16KDT#15组合使用缓慢变化维技术	202
7.17KDT#16热交换维度	202
7.18KDT#17层级结构助手表	203
7.19KDT#18有关出版社的比喻	204 7.20KDT#19保证维度复制的正确	204
7.21	KDT#20稀疏事实表和事实维度表	205
7.22	KDT#21定义事实表的粒度	206
7.23	KDT#22谈谈客户维度	207
7.24KDT#24跨国数据仓库的维度表的设计方法	208
7.25	KDT#25主子表的维度模型设计方法	209
7.26	KDT#26建立审计维度表	209
7.27KDT#27减小离线时间的一种方法	210
7.28	KDT#28避免数据仓库项目灾难性的故障	211
7.29	KDT#29对维度表和事实表进行修改	212
7.30KDT#30减小事实表的容量	214
7.31KDT#31定义实时分区	214
7.32KDT#32数据仓库设计中的折中处理	216
7.33	KDT#33使用CRM的度量对客户进行分析	218
7.34	KDT#34EDW 的几个缺点	220
7.35	KDT#35时间跨度的建模(一)	221
7.36KDT#36关于集中式的考虑	223
7.37KDT#38谈谈分析应用	224
7.38KDT#39谈谈合并数据集市	225
7.39KDT#40分析应用的结构	226
7.40	KDT#41再谈总线矩阵	228
7.41	KDT#42周期快照事实表和累计快照事实表	229
7.42	KDT#43维度建模中处理空值的策略	230
7.43	KDT#44不要过于依赖数据访问工具	231
7.44KDT#46再谈退化维度	231
7.45	KDT#47企业战略目标和业务处理过程的关系	232
7.46	KDT#48再谈杂项维度	233
7.47KDT#49有关“自底向上”的说明	234
7.48	KDT#50再谈非事实型事实表	234 
7.49	KDT#51时间维度表	236
7.50KDT#52改进数据仓库系统的维护工作	236
7.51	KDT#53给维度添加描述属性	238
7.52	KDT#54再谈缓慢变化维	239
7.53	KDT#55文本事实的处理	240
7.54KDT#57早到的事实	241
7.55	KDT#57早到的事实	242
7.56KDT#58BI 门户(WEB 数据仓库)	243
7.57KDT#59数据概况的作用	245
7.58	KDT#64 要避免 DW/BI 的隔离	245
7.59KDT#65为ETL系统做好文档记录	246
7.60KDT#68 一个简单的交叉探察的SQL例子	247
7.61	KDT#69业务处理过程的选择	248
7.62	KDT#70如何规划数据仓库的架构	249
7.63	KDT#71数据建模时的命名方法	250
7.64KDT#72再谈业务处理过程	251
7.65	KDT#73谈谈敏捷开发方法	252
7.66KDT#77维度建模中不要只有汇总数据	252
7.67	KDT#78迟到的维度记录	253
7.68	KDT#79有关维度表的大小	254
7.69	KDT#80给维度表添加变化原因列	254
7.70KDT#81事实表中的代理键	255
7.71	KDT#82改变事实表的粒度	256
7.72	KDT#91 DW/BI 系统的营销	256
7.73	KDT#94为DW/BI系统建立定制工具	258
7.74	KDT#96像应用软件开发经理一样思维	260
8	ETL	264
8.1	ETL架构师面试题(转)	264
8.2	ETL架构师面试题(中文)	266
8.3浅析逻辑数据映射	268
8.4浅析数据探索阶段	269
8.5浅析起始来源数据	269
8.6浅析ETL过程的四步	270
8.7浅析数据准备区中的数据结构	271
8.8	浅析 Staging	272
8.9浅析异构数据抽取	273
8.10浅析ERP数据的抽取	273
8.11浅析数据库连接方式	274
8.12浅析变化数据捕获	274
8.13浅析数据质量检查	275
8.14浅析何时进行概况分析	276
8.15浅析数据质量检查的交付物	276
8.16浅析量化分析数据质量	277
8.17浅析代理键替换管道	277
8.18浅析ETL中对日期的处理	278
8.19浅析一致性维度的交付步骤	278
8.20浅析基本事实表的ETL处理	279
8.21浅析桥接表的作用	280
8.22浅析迟到数据的处理	280
8.23浅析ETL过程中的元数据	281
8.24浅析操作型元数据	282
8.25浅析共享元数据的方法	282
8.26浅析数据加载顺序	283
8.27浅析ETL的技术支持	284
8.28浅析查找ETL系统瓶颈	285
8.29浅析评估数据加载时间	286
8.30浅析实时ETL的架构选择	287
8.31浅析实时ETL的实现方法及适用范围	288 8.32浅析实时ETL的实现难点	290
9文集	290
9.1	BILL INMON	290
9.1.1	Inmon 文集	290
9.1.2数据专员	291
9.1.3不同类型的操作数据存储	292
9.1.4数据仓库走向成熟的几个阶段	293
9.1.5网络化的数据仓库环境	295
9.1.6何时在数据仓库中使用星型结构	304
9.1.7数据仓库的质量目标	306
9.2	RALPH KIMBALL	307
9.2.1	Kimball Group 文集	307
9.2.2维度建模中的数据存储	307
9.2.3克服收集业务需求中的障碍	311
9.2.4如何来应用最佳实践	315
9.2.5	ETL架构中的38个子系统	318
10TTNN BI 观点	322
10.1	再谈 ODS	322
10.2星型模型和雪花模型	324
10.3数据仓库的发展和软件的发展共性分析	326
10.4	浅析 DW2.0 架构	336
10.5关于XMiner的讨论	338
10.6	再谈 CONFOMDED TABLE	339
10.7浅析联邦式数据仓库架构	340
10.8	ETL的38个系统模块	341
10.9谈谈金融领域的风险分析方向	342
10.10谈谈数据仓库架构的发展和分类	347
10.11谈谈数据的用途和分类	349
...展开收缩
综合评分:4.1(60位用户评分)
开通VIP C币充值 立即下载

评论共有39条

qq_246250472017-12-05 16:08:49
解压咋打不开?
l3303852042017-11-23 14:50:00
感谢分享,里面可以学到很多东西
mar_ljh2017-11-09 14:23:15
不错,值得学习1

登录后才能评论

 

相关推荐

第三章_数据仓库中的ETL和元数据PPT 立即下载
积分/C币:3
数据仓库中的ETL和元数据 立即下载
积分/C币:3
数据仓库建模 Powerdesigner 维度建模 软件分析 建模 视频教程 立即下载
积分/C币:5
STAR SCHEMA完全参考手册:数据仓库维度设计权威指南 立即下载
积分/C币:12
etl技术介绍 数据仓库 立即下载
积分/C币:3
数据仓库ETL工具箱 中文版 立即下载
积分/C币:3
ETL构建数据仓库 立即下载
积分/C币:3
ETL架构师面试题+PowerCenter+数据仓库 立即下载
积分/C币:3
DW2.0 下一代数据仓库的构架.pdf 立即下载
积分/C币:10
数据仓库ETL算法详解 立即下载
积分/C币:10
数据仓库中ETL技术的研究 立即下载
积分/C币:3
数据仓库ETL工具箱 立即下载
积分/C币:3
数据仓库ETL工具箱.pdf 立即下载
积分/C币:10
数据仓库建模与ETL的实践技巧 立即下载
积分/C币:3
sybase数据仓库结构用户开发指南part2 立即下载
积分/C币:3
数据仓库元数据理解 立即下载
积分/C币:10
数据仓库维度建模笔记 立即下载
积分/C币:3
数据仓库(DW)与操作型数据存储(ODS) 立即下载
积分/C币:5
SQL Server 2005大型数据仓库系统设计经验分享 立即下载
积分/C币:3
Data warehouse ETL Toolkit(中文版)数据仓库ETL工具箱 立即下载
积分/C币:10

热门专辑

VIP会员动态

关闭
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
扫码关注并点击右下角获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

数据仓库读书笔记(阐述了DW,MDM,ETL,3NF,维度,事实表,粒度,元数据,移植,安全,数据质量,项目经验)(2/2)

会员到期时间: 剩余下载个数: 剩余C币:593 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
(仅够下载10个资源)
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
为了良好体验,不建议使用迅雷下载
C币充值 开通VIP
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可奖励5下载分

  • 举报人:
  • 被举报人:
  • 举报的资源分:
  • *类型:
  • *详细原因: