没有合适的资源?快使用搜索试试~ 我知道了~
spark-dataflow:提供用于执行数据流管道的 Spark 后端
共28个文件
java:20个
xml:2个
txt:2个
需积分: 10 0 下载量 40 浏览量
2021-06-09
10:13:31
上传
评论
收藏 48KB ZIP 举报
温馨提示
火花数据流 介绍 Spark-dataflow 允许用户使用 Apache Spark 执行针对 Google Cloud Dataflow API 编写的数据管道。 Spark-dataflow 是一个早期的原型,我们将继续致力于它。 如果您对这个项目感兴趣,我们欢迎问题、评论和(尤其是!)拉取请求。 要了解我们已经确定的需要改进的领域,请查看 github 存储库中列出的问题。 动机 当我们开始研究 Spark-dataflow 时,我们有两个主要目标: 为为 Google Cloud Dataflow 编写的数据管道提供可移植性。 Google 让开始针对 Dataflow API 编写管道变得非常容易,但他们希望确保使用他们的工具创建管道不会将开发人员锁定在他们的平台上。 基于 Spark 的 Dataflow 实现意味着您可以随身携带管道逻辑。 这也意味着针对 Dataflow
资源推荐
资源详情
资源评论
收起资源包目录
spark-dataflow-master.zip (28个子文件)
spark-dataflow-master
src
test
resources
person.avsc 856B
test_text.txt 23B
java
com
cloudera
dataflow
spark
MultiOutputWordCountTest.java 6KB
AvroPipelineTest.java 4KB
TestSparkPipelineOptionsFactory.java 1KB
SimpleWordCountTest.java 4KB
CombinePerKeyTest.java 3KB
TransformTranslatorTest.java 3KB
main
java
com
cloudera
dataflow
spark
EvaluationContext.java 6KB
EvaluationResult.java 2KB
BroadcastHelper.java 2KB
TransformEvaluator.java 837B
SparkRuntimeContext.java 7KB
CoderHelpers.java 4KB
SparkPipelineOptions.java 1KB
aggregators
AggAccumParam.java 1KB
NamedAggregators.java 7KB
SparkPipelineOptionsFactory.java 890B
MultiDoFnFunction.java 5KB
TransformTranslator.java 19KB
DoFnFunction.java 5KB
SparkPipelineRunner.java 6KB
build-resources
header-file.txt 564B
checkstyle.xml 9KB
LICENSE 21KB
README.md 3KB
pom.xml 13KB
.gitignore 96B
共 28 条
- 1
资源评论
Dilwanga
- 粉丝: 23
- 资源: 4681
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功