没有合适的资源?快使用搜索试试~ 我知道了~
芝加哥出租车行程分析:使用AWS EMR,Spark,PySpark,Zeppelin和Airbnb的Superset分析芝加哥...
共18个文件
png:11个
md:3个
license:1个
需积分: 49 6 下载量 86 浏览量
2021-02-05
06:34:41
上传
评论
收藏 941KB ZIP 举报
温馨提示
总览 使用AWS EMR,Spark,PySpark,Zeppelin和Airbnb的Superset分析芝加哥市区出租车行程数据集 芝加哥市出租车旅行数据集 步骤1:数据整形/合并 分析原始数据 执行基本转换 重命名列 数据类型变更 添加新列 筛选行 筛选栏 执行基本数据处理并将Spark DataFrame保存为Parquet格式。 以下是所有转换后的Spark DataFrame模式。 root | -- TripID: string (nullable = true) | -- TaxiID: string (nullable = true) | -- TripStartTS:
资源推荐
资源详情
资源评论
收起资源包目录
chicago-taxi-trips-analysis-master.zip (18个子文件)
chicago-taxi-trips-analysis-master
screenshots
zeppelin_trip_count_by_hour.PNG 49KB
superset_presto_table.PNG 74KB
zeppelin_trip_count_by_community_area.PNG 83KB
superset_dashboard.PNG 206KB
zeppelin_mom_trips.PNG 56KB
presto.PNG 132KB
zeppelin_trip_count_by_month.PNG 40KB
zeppelin_trip_count_by_day_of_month.PNG 45KB
zeppelin_trip_count_monthly_trips.PNG 73KB
superset_dashboard2.png 204KB
superset_presto_datasource.PNG 74KB
LICENSE 11KB
zeppelin.md 309B
presto-superset.md 334B
chi-taxi-data-csv-aws-parquet.py 8KB
note.json 78KB
README.md 7KB
20170706_200233.pickle 35KB
共 18 条
- 1
资源评论
tafan
- 粉丝: 34
- 资源: 4652
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功