没有合适的资源?快使用搜索试试~ 我知道了~
data_processing_course:使用PySpark进行数据处理课程的一些课堂资料
共131个文件
py:42个
csv:12个
md:11个
需积分: 15 0 下载量 101 浏览量
2021-05-14
12:59:35
上传
评论
收藏 473KB ZIP 举报
温馨提示
使用Spark进行数据处理 瓦伦西亚理工大学硕士的高级数据处理课程的材料。 本课程提供了30小时的概述,介绍了使用Spark进行数据处理的许多概念,技术和工具,其中包括来自Apache Beam的一些关键概念。 我们假设您熟悉Python,但是所有练习都可以在Java和Scala中轻松完成。 我们为和包含了Vagrant定义和docker映像。 如果您发现错误或想要发表评论,请或直接。 您可以自由地重复使用课程资料,请遵循详细信息。 结构 A部分-Spark 函数式编程简介 Spark基础知识 PySpark:转换,操作和基本IO Spark SQL MLib 图表 GraphX(Scala) GraphFrames(Python) Spark集群部署 聚类 阿帕奇光束 幻灯片(即将推出) 米尼欧 Apache Airflow:协调工作 基本设定 达格 云作曲家 B部分
资源推荐
资源详情
资源评论
收起资源包目录
data_processing_course:使用PySpark进行数据处理课程的一些课堂资料 (131个子文件)
_common_metadata 1KB
_metadata 3KB
_SUCCESS 0B
_template_rdd 357B
_template_sql 168B
beam 330B
.part-r-00000-699887c3-5b1f-4afb-ae91-da7750b810c7.gz.parquet.crc 292B
ratings.csv 317KB
compras_tiny.csv 218KB
nasdaq.csv 177KB
containers.csv 92KB
containers_tiny.csv 91KB
pelicula_usuarios.csv 55KB
peliculas.csv 29KB
iso-container-codes.csv 22KB
ship_routes.csv 4KB
country_codes.csv 3KB
iso-container-groups.csv 594B
pelicula_ids.csv 484B
data 11B
data 7B
Dockerfile 844B
Dockerfile 627B
Dockerfile 434B
Dockerfile 392B
Dockerfile 267B
.dockerignore 117B
.envrc 217B
.envrc 59B
Gemfile 42B
.gitignore 155B
.gitignore 117B
.gitignore 107B
.gitignore 61B
.gitignore 4B
live_template.html 1KB
pytest.ini 108B
live.ipynb 700B
nasdaq.json 257KB
iso-container-codes.json 63KB
exchange_rates_usd.json 446B
config.json 371B
uploads.json 34B
downloads.json 34B
LICENSE 239B
Gemfile.lock 223B
Makefile 857B
Makefile 634B
Makefile 479B
Makefile 392B
Makefile 265B
mc 208B
README.md 10KB
README.md 6KB
kubernetes.md 5KB
docker.md 4KB
single-node.md 3KB
vagrant.md 1KB
beam.md 912B
README.md 523B
README.md 13B
README.md 9B
README.md 7B
config.json.old 625B
part-r-00000-699887c3-5b1f-4afb-ae91-da7750b810c7.gz.parquet 35KB
enable_history.properties 204B
contenedores.py 3KB
peliculas_1_mllib.py 3KB
helpers.py 2KB
helpers.py 2KB
conftest.py 2KB
spark_ondemand.py 2KB
compras_ptransform_condensed.py 2KB
compras_con_mas_de_un_descuento.py 1KB
container.py 1KB
compras_ptransform.py 1KB
ship_routes.py 1KB
hft.py 1KB
test_ejercicio_5.py 1KB
container_convertir_a_parquet.py 1KB
compras_totales_por_pais.py 1KB
compras_conversion_a_dolares.py 1KB
spark_simple.py 998B
peliculas_0_ml.py 931B
hello_dags.py 891B
test_ejercicio_4.py 890B
test_ejercicio_3.py 874B
compras_top_ten_countries.py 868B
test_ejercicio_6.py 858B
basic.py 838B
container_rdd_to_dataset.py 786B
container_partition.py 764B
compras.py 687B
test_ejercicio_2.py 654B
container_databricks_csv.py 618B
hello_python_operator.py 602B
container_caching.py 599B
friends.py 504B
test_ejercicio_7.py 472B
compras_importe_total_agrupado_por_tx_id.py 450B
共 131 条
- 1
- 2
资源评论
粢范团
- 粉丝: 31
- 资源: 4697
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功