没有合适的资源?快使用搜索试试~ 我知道了~
data_engineering
共12个文件
py:4个
ipynb:3个
md:2个
需积分: 5 0 下载量 158 浏览量
2021-04-05
11:36:57
上传
评论
收藏 334KB ZIP 举报
温馨提示
项目简介: 这个项目是关于Postgres中的维度建模概念以及具有提取转换和加载数据的数据建模 数据库设计: 用于分析数据通过使用SQL和星型方案(也使用关系数据库),Sparkify还可以对其数据库执行广告分析。 ETL流程: 使用Sparkify分析他们的数据,创建了一个关系数据库架构,可以用ETL管道填充它。 所谓的星型方案使公司可以从多个维度查看用户行为。 事实表用于存储包含“ NextSong”类别的所有用户歌曲活动。 公司可以使用此表来关联和分析用户,歌曲,艺术家和时间的维度。 填充关系数据库,使用ETL管道,这使得可以从用户行为的日志文件中提取信息,以及将数据转换为模式。 事实表和尺寸表 项目存储库文件: data:包含歌曲和日志数据的文件夹create_tables.py:执行用于(重新)创建数据库和表SQL语句的Python脚本sql_queries.py:
资源推荐
资源详情
资源评论
收起资源包目录
data_engineering-main.zip (12个子文件)
data_engineering-main
data-modeling-cassandra
project_1b.ipynb 14KB
image_event_datafile_new.jpg 360KB
README.md 2KB
data_engineering
data-modeling-with-postgres
md 2KB
test.ipynb 2KB
etl.py 3KB
er_diagram.py 286B
__pycache__
sql_queries.cpython-38.pyc 2KB
sql_queries.py 3KB
etl.ipynb 12KB
create_tables.py 2KB
.gitignore 2KB
共 12 条
- 1
资源评论
大英勋爵汉弗莱
- 粉丝: 35
- 资源: 4492
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功