img

开源集群计算系统Spark

Spark目的是让数据分析更加快速,在 Scala 语言中实现的,将 Scala 用作其应用程序框架。项目的core部分的代码只有63个Scala文件,非常短小精悍。Spark 是一种与Hadoop 相似的开源集群计算环境,启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。

共4个

[Spark] Spark 快速数据处理 (英文版)
Spark Contributor陈超分享深入浅出Spark
Spark快速数据处理
spark源码分析_20140521