没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
kettle 8.2 ETL 项目实战教程
01 项目简介
01 Sakila 简介
业务简介
是在线 租赁商店系统的数据库, 示例数据库最初由 文档团队的
前成员 开发,现在由 文档团队维护和销售。 的主要目的是支撑
租赁商店的业务流程,下面列举了一些业务流程活动中的关键点来理解数据库是如何
支撑的。
每个商店维护自己的租赁影片清单,当客户取走或归还 光盘时会有一个专门的店
员对这个清单进行维护。
影片描述的内容同样在维护信息范围之内,如分类(动作、冒险、喜剧等)、演员、
等级、特殊分类(例如被删除的情节和预告片)。这些信息可能被打印在 包装的
标签上。
必须在商店注册成为会员才可以租赁光盘。
客户可以在任何一家商店租赁一张或多张光盘,同时,商店希望客户在每张光盘对应
的租赁期内归还之前租赁的光盘。
顾客可以在任意时间对任何租赁的光盘付费。
Sakila 数据库的表
序号 表名(英文) 表名(中文)
1 actor
演员表
2 address
地址表
3 category
类别表
4 city
城市表
5 country
国家表
6 customer
客户表
7 lm
电影表
8 lm_actor
电影_演员表
9 lm_category
电影_类别表
10 lm_text
电影_文本表
11 inventory
库存表
12 language
语言表
13 payment
付款表
14 rental
租赁表
15 sta
工作人员表
16 store
商店表
总体设计规范
每张表都有自增主键列,列名采用“表名_id”的规则命名,如表 lm 的自增列为
lm_id。
外键约束引用主键,且名字与主键列的相同。例如,表 store 的 address_id 列引用
addess 的 address_id 列。
每张表有一个列叫做 last_update,这是一个 TIMESTAMP 类型的字段,用来记录增
加或更新数据时的时间。
sakila 模型关系图
02 安装 sakila 数据库
软件:
在 的文件夹下有两个 脚本文件。
创建数据库和表
插入数据
03 维度建模
维度建模基本概念
维度建模!"""#$是专门用于分析型数据库、数据仓库、数据集市建模
的方法。数据集市可以理解为是一种%小型数据仓库%。
维度表 (dimension)
维度表示你要对数据进行分析时所用的一个量&比如你要分析产品销售情况&你可以选择
按类别来进行分析&或按区域来分析。这样的按分析就构成一个维度。再比如%昨天下午我
在星巴克花费'((元喝了一杯卡布奇诺%。那么以消费为主题进行分析,可从这段信息中提
取三个维度:时间维度!昨天下午$,地点维度!星巴克$&商品维度!卡布奇诺$。通常来说维度
表信息比较固定,且数据量小。
事实表 (fact table)
表示对分析主题的度量。事实表包含了与各维度表相关联的外键,并通过 )*+方式与
维度表关联。事实表的度量通常是数值类型,且记录数会不断增加,表规模迅速增长。比
如上面的消费例子,它的消费事实表结构示例如下:
消费事实表:,-!引用商品维度表$&./!引用时间维度表$&,-!引用地点维
度表$&0"!销售量$。
总的说来,在数据仓库中不需要严格遵守规范化设计原则。因为数据仓库的主导功能就是
面向分析,以查询为主,不涉及数据更新操作。事实表的设计是以能够正确记录历史信息
为准则,维度表的设计是以能够以合适的角度来聚合主题内容为准则。
维度建模三种模式
星型模式
星形模式!$是最常用的维度建模方式。星型模式是以事实表为中心,所有
的维度表直接连接在事实表上,像星星一样。
星形模式的维度建模由一个事实表和一组维表成,且具有以下特点:
维表只和事实表关联,维表之间没有关联;
每个维表主键为单列,且该主键放置在事实表中,作为两边连接的外键;
以事实表为核心,维表围绕核心呈星形分布;
雪花模式
雪花模式!"12$是对星形模式的扩展。雪花模式的维度表可以拥有其他维
度表的,虽然这种模型相比星型更规范一些,但是由于这种模型不太容易理解,维护成本
比较高,而且性能方面需要关联多层维表,性能也比星型模型要低。所以一般不是很常用。
剩余63页未读,继续阅读
资源评论
傲娇猪儿
- 粉丝: 145
- 资源: 25
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功