没有合适的资源?快使用搜索试试~ 我知道了~
可扩展数据科学平台:用于使用Luigi,Spark和Flask为产品构建数据科学平台的内容
共50个文件
py:20个
csv:7个
crc:6个
需积分: 9 1 下载量 133 浏览量
2021-02-05
17:55:58
上传
评论
收藏 23.49MB ZIP 举报
温馨提示
构建可扩展的数据科学平台(Luigi,Apache Spark,Pandas,Flask) 第五届大象2016 [ ] [] 抽象 “在理论上,理论与实践之间没有区别。但是在实践中,两者之间没有区别。” -瑜伽士贝拉 一旦在本地计算机上完成了数据科学解决方案原型的任务,真正的挑战就在于如何使它在生产中工作。 确保数据管道的管道将在大规模生产中发挥作用是一门艺术,也是一门科学。 科学涉及了解使数据管道连接所需的不同工具和技术,而现有技术涉及进行调整数据管道以使其流动所需的权衡。 在本研讨会中,您将学习如何使用Pandas和Luigi建立并进行数据工程来构建可扩展的数据科学平台,如何使用Ap
资源推荐
资源详情
资源评论
收起资源包目录
scalable-data-science-platform-master.zip (50个子文件)
scalable-data-science-platform-master
logs
.keep 0B
Vagrantfile 373B
app.md 1KB
luigi_tasks
__init__.py 0B
terminal_traffic_task.py 1KB
load_trip_task.py 634B
query_db_task.py 1KB
requirements.txt 372B
LICENSE 1KB
README.md 9KB
Testing the data.ipynb 46KB
client.cfg 854B
data
trip_data.csv 76.49MB
201508_trip_data.csv 41.02MB
201508_weather_data.csv 155KB
201408_trip_data.csv 19.69MB
201408_weather_data.csv 78KB
201402_weather_data.csv 79KB
201402_trip_data.csv 16.42MB
postgres.md 27B
.gitignore 1KB
runserver.py 372B
poget
utils
db.py 947B
ml.py 976B
__init__.py 0B
luigi.py 218B
logger.py 1KB
config.py 345B
models
terminal-traffic
data
._common_metadata.crc 16B
part-r-00000-0e70e36b-3fa4-4652-a2ae-96a321500e92.gz.parquet 2KB
_metadata 2KB
.part-r-00000-0e70e36b-3fa4-4652-a2ae-96a321500e92.gz.parquet.crc 24B
_SUCCESS 0B
_common_metadata 987B
._metadata.crc 24B
._SUCCESS.crc 8B
metadata
_SUCCESS 0B
.part-00000.crc 12B
._SUCCESS.crc 8B
part-00000 121B
__init__.py 91B
analytics
ml
logistic_regression.py 4KB
__init__.py 0B
linear_regression.py 4KB
terminal_traffic.py 5KB
terminal_transactions.py 2KB
data_load
bay_bike_share.py 1KB
create.sql 78B
api
routes.py 2KB
__init__.py 196B
共 50 条
- 1
资源评论
靳骁曈
- 粉丝: 23
- 资源: 4680
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功