taxi-poc-aws:适用于创新架构师的AWS分配
5星 · 超过95%的资源 需积分: 0 100 浏览量
更新于2021-04-11
收藏 718KB ZIP 举报
滑行poc-aws
AWS Assignment for Innovation Architect:从TLC检索数据并为不同用户生成插图。
这个项目是什么?
如前所述,这是一个用于AWS采访的项目。
因此,所有事物都基于aws。
数据预处理
脚步:
创建一个名为taxi-poc格式的s3存储桶,并创建一个EMR集群。
将format_and_split_csv.py添加到集群的步骤中,直到完成。
现在,您将在s3上以的士格式设置存储桶中获得漂亮的数据。
额外的:
从2015年到2018年,开放数据中的数据格式不一致。 因此,我们必须探索数据格式:
运行scan_data_types.py以获取所有标头类型。
还有一个问题:某些数据没有取放地点纬度和经度。 他们只有位置ID。
运行scan_location_latlng.py以从Google API获取位置的经纬度。
数
每天痛苦与更好的
- 粉丝: 36
- 资源: 4536
最新资源
- 影刀RPA高级操作二.txt
- cadance 1.8v LDO电路 cadance virtuoso 设计 模拟电路设计 LDO带隙基准电路设计 带设计报告(14页word) 基于tsmc18工艺 模拟ic设计 bandgap+L
- 椭圆拟合方法用于电子衍射花样的快速精确分析
- 基于java的影城管理系统设计新版源码+数据库+说明
- 基于java的幼儿园管理系统设计新版源码+数据库+说明
- 文明6mod发布:华夏历史的政策拓展包(中央集权、军功爵制、穷兵黩武)
- comsol仿真 PEM电解槽三维两相流模拟,包括电化学,两相流传质,析氢析氧,化学反应热等多物理场耦合,软件comsol,可分析多孔介质传质,析氢析氧过程对电解槽电流密度分布,氢气体积分数,氧气
- 《Internet程序开发基础》课程大作业
- Android studio 健康管理系统期末大作业App源码
- 基于java的准妈妈孕期交流平台设计新版源码+数据库+说明
- 基于java的自习室预订系统设计新版源码+数据库+说明
- 基于java的租房网站设计新版源码+数据库+说明
- yolo条形码&二维码检测数据集
- 使用Python与梯度回归树及夏普利方法进行社会调查数据分析及模型训练(含代码及解释)
- ISSA多策略改进麻雀优化ISSA-CNN-BiLSTM 多输入单输出回归 python代码 优化参数:filter,unints1,units2,学习率(可添加) 以下是三个主要的改进点: sin混
- 油棕种植生态指标的探索性评估:环境可持续性的方法与挑战