没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
spark-train 目录结构说明 Accumulator 计数器的使用 Broadcast 使用Spark实现Common Join和Map Join MultipleOutput & Job run more 多目录输出(即partition by操作)和作业重跑机制的实现 MergeSmallFile 小文件的合并 ScalaOpHDFS Scala操作HDFS文件系统,修改Spark输出到HDFS上的文件的名字 Spark SQL Debug Spark SQL Debug操作指南 data 测试数据 注意: 所有的实现都是基于Spark Core实现的,基于Spark SQL的实现,部分章节将会在后续进行更新
资源详情
资源评论
资源推荐
收起资源包目录
spark-train-master.zip (20个子文件)
spark-train-master
06-Spark SQL Debug
Spark SQL Debug.pdf 1.38MB
data
emp3.txt 36KB
emp2.txt 701B
emp1.txt 656B
04-MergeSmallFile
SmallFile
src
MergeSmallFile.scala 5KB
README.md 505B
02-Broadcast
Broadcast Code
src
BroadcastApp.scala 2KB
README.md 124B
05-ScalaOpHDFS
ScalaOpHDFS
src
HDFSUtil.scala 1KB
ScalaHDFSOp.scala 2KB
ScalaChangeFile.scala 2KB
README.md 587B
README.md 614B
01-Accumulator
Accumulator Code
src
AccumulatorsApp.scala 1KB
README.md 1KB
03-MultipleOutput & Job run more
01-MultipleOutput
src
case1.scala 3KB
case2.scala 3KB
case3.scala 2KB
02-Job run more
src
case4.scala 4KB
README.md 1KB
共 20 条
- 1
janejane815
- 粉丝: 24
- 资源: 4611
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0