没有合适的资源?快使用搜索试试~ 我知道了~
data-systems:演示和动手教程,关于现代数据系统
共14个文件
md:6个
pdf:5个
ipynb:2个
需积分: 7 0 下载量 188 浏览量
2021-03-11
17:29:27
上传
评论
收藏 4.13MB ZIP 举报
温馨提示
数据系统概论 该存储库包含一组有关巴黎南硕士课程的Data Lake课程的演示文稿和动手教程。 我决定打开此模块的内容以: 使任何想要学习数据工程的人都可以使用它 通过公开和开放供稿来提高模块的质量 内容 简报: 涵盖: 什么是大数据 从DataWarehouse到Data Lake 数据处理架构: Lambda架构和kappa架构 HDFS的设计目标和概念 HDFS中的数据操作说明数据存储格式简介: avro , orc和parquet 数据整合问题 什么是write ahead log Apache Kafka概念 关于CAP Theorem No-SQL数据库上的类 MongoDB简介 教程: + 使用Kafka和Spark进行 执照
资源详情
资源评论
资源推荐
收起资源包目录
data-systems-master.zip (14个子文件)
data-systems-master
presentations
IntroductionToNoSQL.pdf 1.66MB
IntroductionToDataSystems.pdf 1.83MB
ModuleIntroduction.pdf 136KB
DataStreamingWithApacheKafka.pdf 524KB
IntroductionToHDFS.pdf 701KB
LICENSE 1KB
tutorials
working_with_hdfs.md 11KB
working_with_kafka.md 24KB
working_with_mongodb.md 16KB
working_with_window_functions.ipynb 22KB
working_with_file_formats.md 6KB
working_with_spark_and_kafka.md 6KB
working_with_spark.ipynb 91KB
README.md 3KB
共 14 条
- 1
以网为生
- 粉丝: 28
- 资源: 4595
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0