• 数据仓库工具箱:维度建模的完全指南·第二版(中文高清版)(2/2)

      本书从维度结构建模的基本知识入手,通过给出零售、库存、采购、定单管理、顾客关系管理、帐目、人力资源管理、财经服务、电信与公用事业、交通、教育、卫生护理、电子商务以及保险等方面的实例研究,全面、深入、透彻与具体地介绍了利用维度模型设计与开发数据仓库的综合技术知识。同时,本书对数据仓库在当前社会与技术背景下的发展前景进行了很有远见的探索。   本书先介绍基本知识,然后逐个讨论具体实例内容,最后进行综合总体分析,在内容的结构方面很有特色。 本书涉及的行业较多,但这些内容从不同角度体现了数据仓库的各个方面,因而对于完整地学习与掌握数据仓库知识显得十分必要。 本书主要是为数据仓库设计人员、技术人员以及管理人员而写的。此外,对于积极参与数据仓库的初期规划工作的业务分析人员来说,本书也有很好的学习价值。 目录 ↑第1章 维度建模初步 1 1.1 信息应用的不同领域 1 1.2 数据仓库的最终目标 2 1.2.1 出版业方面的比喻实例 4 1.3 数据仓库的组成 6 1.3.1 操作型源系统 7 1.3.2 数据聚集环节 7 1.3.3 数据展示 9 1.3.4 数据存取工具 12 1.3.5 其他要考虑的内容 13 1.4 维度建模词汇表 15 1.4.1 事实表 15 1.4.2 维度表 18 1.4.3 事实与维度的融合 20 1.5 关于维度建模的神话 22 1.5.1 应该避免的常见疏误 24 1.6 总结 25 第2章 零售营销 26 2.1 四步维度设计过程 27 2.2 零售实例的研究 28 .2.2.1 第一步:选取业务处理 30 2.2.2 第二步:定义粒度 30 2.2.3 第三步:选定维度 31 2.2.4 第四步:确定事实 32 2.3 维度表属性 34 2.3.1 日期维度 35 2.3.2 产品维度 39 2.3.3 商场维度 42 2.3.4 促销维度 43 2.3.5 退化的事务编号维度 46 2.4 零售方案的运用 48 2.5 零售方案的扩展 49 2.6 经受住安逸诱惑的考验 52 2.6.1 维度的规范化处理(雪花处理) 52 2.6.2 维度使用过多 54 2.7 代理关键字 56 2.8 市场篮子分析 59 2.9 总结 62 第3章 库存 63 3.1 值链的引入 63 3.2 库存模型 64 3.2.1 周期库存快照 65 3.2.2 库存事务 69 3.2.3 库存累积快照 70 3.3 值链的集成 72 3.4 数据仓库总线结构 73 3.4.1 数据仓库总线矩阵 75 3.4.2 一致性维度 78 3.4.3 一致性事实 82 3.5 总结 83 第4章 采购 84 4.1 采购案例研究 84 4.2 采购事务 85 4.2.1 多事务事实表与单事务事实表 86 4.2.2 辅助性采购快照 89 4.3 渐变维度 89 4.3.1 类型1:改写属性值 90 4.3.2 类型2:添加维度行 91 4.3.3 类型3:添加维度列 94 4.4 混合渐变维度处理方法 96 4.4.1 可预见的多重变化 96 4.4.2 不可预见的单重变化 97 4.5 快变维度 98 4.6 总结 99 第5章 订单管理 100 5.1 订单管理的引入 101 5.2 订单事务 101 5.2.1 事实的规范化 102 5.2.2 维度的角色模仿 103 5.2.3 再谈产品维度 104 5.2.4 收货顾客维度 106 5.2.5 交易维度 108 5.2.6 订单编号退化维度 109 5.2.7 杂项维度 110 5.2.8 多种流通货币 112 5.2.9 粒度不同的标题与分列项事实 113 5.2.10 发票事务 115 5.2.11 赢利与亏损事实 116 5.2.12 利润率:最有效能的数据中心 118 5.2.13 利润率方面的告诫 119 5.2.14 顾客满意度事实 119 5.3 订单任务流水线累积快照 120 5.3.1 延迟计算 122 5.3.2 多个计量单位 123 5.3.3 后视图镜像 124 5.4 事实表的比较 125 5.4.1 事务事实表 125 5.4.2 周期快照事实表 126 5.4.3 累积快照事实表 126 5.5 实时分区的设计 127 5.5.1 实时分区的条件 128 5.5.2 事务粒度的实时分区 128 5.5.3 周期快照的实时分区 129 5.5.4 累积快照的实时分区 130 5.6 总结 131 第6章 客户关系管理 132 6.1 crm概述 133 6.1.1 操作型与分析型crm 134 6.1.2 crm封装组件 136 6.2 客户维度 136 6.2.1 姓名与地址解析 137 6.2.2 常见的其他客户属性 141 6.2.3 低基数属性集的维度支架 143 6.2.4 大型变化客户维度 144 6.2.5 类型2客户维度变化的内容 150 6.2.6 客户行为研究组 150 6.2.7 商务客户体系结构 152 6.2.8 多源客户数据的组合 158 6.3 多业务处理的客户数据分析 159 6.4 总结 160 第7章 账目 162 7.1 账目案例研究 162 7.2 一般分类总账方面的数据 163 7.2.1 一般分类总账周期快照 164 7.2.2 一般分类总账日记账分录事务 166 7.2.3 财务报表 169 7.3 预算处理 169 7.3.1 合并事实表 172 7.4 olap与封装分析型方案的角色 174 7.5 总结 175 第8章 人力资源管理 176 8.1 维度中时间标记事务的跟踪 176 8.1.1 具有周期快照事实的时间标记维度 180 8.2 审计维度 181 8.3 关键词支架维度 183 8.3.1 选择and与or方面的难题 184 8.3.2 搜索子字符串 184 8.4 调查表数据 186 8.5 总结 187 第9章 财经服务 188 9.1 银行业案例研究 188 9.2 维度精选 189 9.2.1 家庭维度 192 9.2.2 多值维度 193 9.2.3 再谈微型维度 194 9.3 事实的自由值分段 195 9.4 时间点结余 197 9.5 异构产品方案 199 9.5.1 事务事实异构产品 203 9.6 总结 203 第10章 电信与公用事业 205 10.1 电信实例研究 205 10.2 设计复查要考虑的一般因素 208 10.2.1 粒度 208 10.2.2 日期维度 209 10.2.3 退化维度 210 10.2.4 维度解释与描述 210 10.2.5 代理关键字 211 10.2.6 维度太多(或者太少) 211 10.3 草案设计活动的讨论 211 10.4 地理位置维度 213 10.4.1 位置支架 214 10.4.2 支撑地理信息系统 214 10.4 总结 215 第11章 交通 216 11.1 飞机常客实例研究 216 11.1.1 多个事实表粒度 217 11.1.2 航段与行程的连接 219 11.2 向其他行业的扩展 221 11.2.1 载运货主 221 11.2.2 旅行社 222 11.3 将微型维度组合成超级维度 223 11.3.1 服务等级 223 11.3.2 起点与目的地 224 11.4 日期与时间方面更多的考虑 226 11.4.1 国别历法 226 11.4.2 作为维度或者事实的日间时间 227 11.4.3 处于多个时区的日期与时间 228 11.5 总结 229 第12章 教育 230 12.1 大学实例研究 230 12.2 用于维度跟踪的累积快照 231 12.3 非事实型事实表 233 12.3.1 学生注册事件 234 12.3.2 设施应用范围 236 12.3.3 学生听课事件 237 12.4 其他领域的分析兴趣 240 12.5 总结 241 第13章 卫生保健 242 13.1 卫生保健值环 242 13.2 卫生保健单据 245 13.2.1 日期维度所模仿的角色 248 13.2.2 多值诊断维度 249 13.2.3 扩展单据事实表以显示利润 252 13.2.4 住院出单维度 253 13.3 复杂卫生保健事件 254 13.4 医药记录 255 13.4.1 用于稀疏事实的事实维度 255 13.5 内容回顾 257 13.5.1 迟到事实行 258 13.5.2 迟到维度行 259 13.6 总结 260 第14章 电子商务 261 14.1 web客户-服务器交互指南 262 14.2 为什么点击流并不仅仅是另外一种数据源 264 14.2.1 跟踪点击流数据所遇到的挑战 265 14.2.2 用于点击流的具体维度 270 14.3 用于整个会话的点击流事实表 275 14.4 用于单个页面事件的点击流事实表 278 14.5 聚集点击流事实表 281 14.6 将点击流数据中心集成到企业数据仓库 282 14.7 商务利润率数据中心 284 14.8 总结 287 第15章 保险 289 15.1 保险实例研究 290 15.1.1 保险值链 291 15.1.2 草拟的保险总线矩阵 292 15.2 保单事务 293 15.2.1 维度细节与方法 293 15.2.2 可选(或者补充)保单累积快照 299 15.3 保单周期快照 299 15.3.1 一致性维度 299 15.3.2 一致性事实 300 15.3.3 再谈异构产品 301 15.3.4 再谈多值维度 302 15.4 更多的保险实例研究背景 302 15.4.1 更新的保险总线矩阵 303 15.5 索赔事务 304 15.6 索赔累积快照 306 15.7 保险/索赔合并快照 308 15.8 非事实型事故事件 309 15.9 维度建模要避免的常见错误 310 15.10 总结 313 第16章 建立数据仓库 314 16.1 业务维度生命周期路线图 315 16.1.1 路线图的主要兴趣点 315 16.2 项目规划与管理 317 16.2.1 准备情况的评估 317 16.2.2 范围的确定 319 16.2.3 论证 319 16.2.4 人力资源配备 319 16.2.5 项目方案的开发与维护 322 16.3 业务需求定义 323 16.3.1 需求规划 323 16.3.2 业务需求收集 325 16.3.3 文档形成与后续整理 327 16.4 生命周期技术路径 329 16.5 技术体系设计 329 16.5.1 创建技术体系的8步过程 330 16.6 产品选购与安装 332 16.7 生命周期数据路径 334 16.8 维度建模 334 16.9 物理设计 336 16.9.1 聚集策略 336 16.9.2 初始索引策略 337 16.10 数据转储系统的设计与开发 338 16.10.1 维度表转储处理 339 16.10.2 事实表转储 341 16.11 生命周期分析型应用路径 342 16.11.1 分析型应用程序说明 343 16.11.2 分析型应用程序的开发 343 16.12 配发 344 16.13 维护与扩展 345 16.14 建立数据仓库需要避免的常见错误 347 16.15 总结 349 第17章 相关知识与展望 350 17.1 正在出现的技术进步 351 17.2 安全需求与隐私影响方面的政治压力 353 17.2.1 有益的使用与具有险恶用心的滥用之间存在冲突 354 17.2.2 由谁掌握个人数据 355 17.2.3 可能发生什么事情 355 17.2.4 监视监控人员如何影响数据仓库的体系 356 17.3 精心设计而避免出现灾难性的失败 358 17.3.1 灾难性故障 358 17.3.2 对灾难性故障的应对 359 17.4 知识产权与公平使用 361 17.5 数据仓库应用方面的文化取向 362 17.5.1 企业范围内的数字管理 362 17.5.2 对复杂的关键性能指标存在更多的信赖 363 17.5.3 行为是新的应用大户 363 17.5.4 封装应用达到顶峰 364 17.5.5 仍然需要应用集成 364 17.5.6 采购数据仓库需要进行审慎的风险评估 365 17.6 结束语 366 术语表 367

    4
    0
    51.81MB
    2013-05-10
    13
  • 数据仓库工具箱:维度建模的完全指南·第二版(中文高清版)(1/2)

      本书从维度结构建模的基本知识入手,通过给出零售、库存、采购、定单管理、顾客关系管理、帐目、人力资源管理、财经服务、电信与公用事业、交通、教育、卫生护理、电子商务以及保险等方面的实例研究,全面、深入、透彻与具体地介绍了利用维度模型设计与开发数据仓库的综合技术知识。同时,本书对数据仓库在当前社会与技术背景下的发展前景进行了很有远见的探索。   本书先介绍基本知识,然后逐个讨论具体实例内容,最后进行综合总体分析,在内容的结构方面很有特色。 本书涉及的行业较多,但这些内容从不同角度体现了数据仓库的各个方面,因而对于完整地学习与掌握数据仓库知识显得十分必要。 本书主要是为数据仓库设计人员、技术人员以及管理人员而写的。此外,对于积极参与数据仓库的初期规划工作的业务分析人员来说,本书也有很好的学习价值。 目录 ↑第1章 维度建模初步 1 1.1 信息应用的不同领域 1 1.2 数据仓库的最终目标 2 1.2.1 出版业方面的比喻实例 4 1.3 数据仓库的组成 6 1.3.1 操作型源系统 7 1.3.2 数据聚集环节 7 1.3.3 数据展示 9 1.3.4 数据存取工具 12 1.3.5 其他要考虑的内容 13 1.4 维度建模词汇表 15 1.4.1 事实表 15 1.4.2 维度表 18 1.4.3 事实与维度的融合 20 1.5 关于维度建模的神话 22 1.5.1 应该避免的常见疏误 24 1.6 总结 25 第2章 零售营销 26 2.1 四步维度设计过程 27 2.2 零售实例的研究 28 .2.2.1 第一步:选取业务处理 30 2.2.2 第二步:定义粒度 30 2.2.3 第三步:选定维度 31 2.2.4 第四步:确定事实 32 2.3 维度表属性 34 2.3.1 日期维度 35 2.3.2 产品维度 39 2.3.3 商场维度 42 2.3.4 促销维度 43 2.3.5 退化的事务编号维度 46 2.4 零售方案的运用 48 2.5 零售方案的扩展 49 2.6 经受住安逸诱惑的考验 52 2.6.1 维度的规范化处理(雪花处理) 52 2.6.2 维度使用过多 54 2.7 代理关键字 56 2.8 市场篮子分析 59 2.9 总结 62 第3章 库存 63 3.1 值链的引入 63 3.2 库存模型 64 3.2.1 周期库存快照 65 3.2.2 库存事务 69 3.2.3 库存累积快照 70 3.3 值链的集成 72 3.4 数据仓库总线结构 73 3.4.1 数据仓库总线矩阵 75 3.4.2 一致性维度 78 3.4.3 一致性事实 82 3.5 总结 83 第4章 采购 84 4.1 采购案例研究 84 4.2 采购事务 85 4.2.1 多事务事实表与单事务事实表 86 4.2.2 辅助性采购快照 89 4.3 渐变维度 89 4.3.1 类型1:改写属性值 90 4.3.2 类型2:添加维度行 91 4.3.3 类型3:添加维度列 94 4.4 混合渐变维度处理方法 96 4.4.1 可预见的多重变化 96 4.4.2 不可预见的单重变化 97 4.5 快变维度 98 4.6 总结 99 第5章 订单管理 100 5.1 订单管理的引入 101 5.2 订单事务 101 5.2.1 事实的规范化 102 5.2.2 维度的角色模仿 103 5.2.3 再谈产品维度 104 5.2.4 收货顾客维度 106 5.2.5 交易维度 108 5.2.6 订单编号退化维度 109 5.2.7 杂项维度 110 5.2.8 多种流通货币 112 5.2.9 粒度不同的标题与分列项事实 113 5.2.10 发票事务 115 5.2.11 赢利与亏损事实 116 5.2.12 利润率:最有效能的数据中心 118 5.2.13 利润率方面的告诫 119 5.2.14 顾客满意度事实 119 5.3 订单任务流水线累积快照 120 5.3.1 延迟计算 122 5.3.2 多个计量单位 123 5.3.3 后视图镜像 124 5.4 事实表的比较 125 5.4.1 事务事实表 125 5.4.2 周期快照事实表 126 5.4.3 累积快照事实表 126 5.5 实时分区的设计 127 5.5.1 实时分区的条件 128 5.5.2 事务粒度的实时分区 128 5.5.3 周期快照的实时分区 129 5.5.4 累积快照的实时分区 130 5.6 总结 131 第6章 客户关系管理 132 6.1 crm概述 133 6.1.1 操作型与分析型crm 134 6.1.2 crm封装组件 136 6.2 客户维度 136 6.2.1 姓名与地址解析 137 6.2.2 常见的其他客户属性 141 6.2.3 低基数属性集的维度支架 143 6.2.4 大型变化客户维度 144 6.2.5 类型2客户维度变化的内容 150 6.2.6 客户行为研究组 150 6.2.7 商务客户体系结构 152 6.2.8 多源客户数据的组合 158 6.3 多业务处理的客户数据分析 159 6.4 总结 160 第7章 账目 162 7.1 账目案例研究 162 7.2 一般分类总账方面的数据 163 7.2.1 一般分类总账周期快照 164 7.2.2 一般分类总账日记账分录事务 166 7.2.3 财务报表 169 7.3 预算处理 169 7.3.1 合并事实表 172 7.4 olap与封装分析型方案的角色 174 7.5 总结 175 第8章 人力资源管理 176 8.1 维度中时间标记事务的跟踪 176 8.1.1 具有周期快照事实的时间标记维度 180 8.2 审计维度 181 8.3 关键词支架维度 183 8.3.1 选择and与or方面的难题 184 8.3.2 搜索子字符串 184 8.4 调查表数据 186 8.5 总结 187 第9章 财经服务 188 9.1 银行业案例研究 188 9.2 维度精选 189 9.2.1 家庭维度 192 9.2.2 多值维度 193 9.2.3 再谈微型维度 194 9.3 事实的自由值分段 195 9.4 时间点结余 197 9.5 异构产品方案 199 9.5.1 事务事实异构产品 203 9.6 总结 203 第10章 电信与公用事业 205 10.1 电信实例研究 205 10.2 设计复查要考虑的一般因素 208 10.2.1 粒度 208 10.2.2 日期维度 209 10.2.3 退化维度 210 10.2.4 维度解释与描述 210 10.2.5 代理关键字 211 10.2.6 维度太多(或者太少) 211 10.3 草案设计活动的讨论 211 10.4 地理位置维度 213 10.4.1 位置支架 214 10.4.2 支撑地理信息系统 214 10.4 总结 215 第11章 交通 216 11.1 飞机常客实例研究 216 11.1.1 多个事实表粒度 217 11.1.2 航段与行程的连接 219 11.2 向其他行业的扩展 221 11.2.1 载运货主 221 11.2.2 旅行社 222 11.3 将微型维度组合成超级维度 223 11.3.1 服务等级 223 11.3.2 起点与目的地 224 11.4 日期与时间方面更多的考虑 226 11.4.1 国别历法 226 11.4.2 作为维度或者事实的日间时间 227 11.4.3 处于多个时区的日期与时间 228 11.5 总结 229 第12章 教育 230 12.1 大学实例研究 230 12.2 用于维度跟踪的累积快照 231 12.3 非事实型事实表 233 12.3.1 学生注册事件 234 12.3.2 设施应用范围 236 12.3.3 学生听课事件 237 12.4 其他领域的分析兴趣 240 12.5 总结 241 第13章 卫生保健 242 13.1 卫生保健值环 242 13.2 卫生保健单据 245 13.2.1 日期维度所模仿的角色 248 13.2.2 多值诊断维度 249 13.2.3 扩展单据事实表以显示利润 252 13.2.4 住院出单维度 253 13.3 复杂卫生保健事件 254 13.4 医药记录 255 13.4.1 用于稀疏事实的事实维度 255 13.5 内容回顾 257 13.5.1 迟到事实行 258 13.5.2 迟到维度行 259 13.6 总结 260 第14章 电子商务 261 14.1 web客户-服务器交互指南 262 14.2 为什么点击流并不仅仅是另外一种数据源 264 14.2.1 跟踪点击流数据所遇到的挑战 265 14.2.2 用于点击流的具体维度 270 14.3 用于整个会话的点击流事实表 275 14.4 用于单个页面事件的点击流事实表 278 14.5 聚集点击流事实表 281 14.6 将点击流数据中心集成到企业数据仓库 282 14.7 商务利润率数据中心 284 14.8 总结 287 第15章 保险 289 15.1 保险实例研究 290 15.1.1 保险值链 291 15.1.2 草拟的保险总线矩阵 292 15.2 保单事务 293 15.2.1 维度细节与方法 293 15.2.2 可选(或者补充)保单累积快照 299 15.3 保单周期快照 299 15.3.1 一致性维度 299 15.3.2 一致性事实 300 15.3.3 再谈异构产品 301 15.3.4 再谈多值维度 302 15.4 更多的保险实例研究背景 302 15.4.1 更新的保险总线矩阵 303 15.5 索赔事务 304 15.6 索赔累积快照 306 15.7 保险/索赔合并快照 308 15.8 非事实型事故事件 309 15.9 维度建模要避免的常见错误 310 15.10 总结 313 第16章 建立数据仓库 314 16.1 业务维度生命周期路线图 315 16.1.1 路线图的主要兴趣点 315 16.2 项目规划与管理 317 16.2.1 准备情况的评估 317 16.2.2 范围的确定 319 16.2.3 论证 319 16.2.4 人力资源配备 319 16.2.5 项目方案的开发与维护 322 16.3 业务需求定义 323 16.3.1 需求规划 323 16.3.2 业务需求收集 325 16.3.3 文档形成与后续整理 327 16.4 生命周期技术路径 329 16.5 技术体系设计 329 16.5.1 创建技术体系的8步过程 330 16.6 产品选购与安装 332 16.7 生命周期数据路径 334 16.8 维度建模 334 16.9 物理设计 336 16.9.1 聚集策略 336 16.9.2 初始索引策略 337 16.10 数据转储系统的设计与开发 338 16.10.1 维度表转储处理 339 16.10.2 事实表转储 341 16.11 生命周期分析型应用路径 342 16.11.1 分析型应用程序说明 343 16.11.2 分析型应用程序的开发 343 16.12 配发 344 16.13 维护与扩展 345 16.14 建立数据仓库需要避免的常见错误 347 16.15 总结 349 第17章 相关知识与展望 350 17.1 正在出现的技术进步 351 17.2 安全需求与隐私影响方面的政治压力 353 17.2.1 有益的使用与具有险恶用心的滥用之间存在冲突 354 17.2.2 由谁掌握个人数据 355 17.2.3 可能发生什么事情 355 17.2.4 监视监控人员如何影响数据仓库的体系 356 17.3 精心设计而避免出现灾难性的失败 358 17.3.1 灾难性故障 358 17.3.2 对灾难性故障的应对 359 17.4 知识产权与公平使用 361 17.5 数据仓库应用方面的文化取向 362 17.5.1 企业范围内的数字管理 362 17.5.2 对复杂的关键性能指标存在更多的信赖 363 17.5.3 行为是新的应用大户 363 17.5.4 封装应用达到顶峰 364 17.5.5 仍然需要应用集成 364 17.5.6 采购数据仓库需要进行审慎的风险评估 365 17.6 结束语 366 术语表 367

    4
    0
    55MB
    2013-05-10
    19
关注 私信
上传资源赚积分or赚钱