没有合适的资源？快使用搜索试试~ 我知道了~

文库首页数据库其它spark core api 的一些demo

spark core api 的一些demo

spark

core

4星 · 超过85%的资源需积分: 9 28 下载量 145 浏览量 2015-04-29 23:35:11 上传评论收藏 4KB TXT 举报

温馨提示

试读

5页

spark core api 的一些demo，很好，很不错，哈哈。

资源推荐

资源详情

资源评论

spark_cpp_api:本工程只是做些实验性的工作。利用JNI，为Spark-0.6.0开发了一点点C++ API，目前能成功运行wordcount，kmeans，还在开发中，一些环境变量的配置没有更改，如有想下载运行的话，可能要花点时间配置一下。以后还会继续更新，等到一些配置好了，会更新通知。e-mail：zhgwen@outlook.com

spark_cpp_api 本工程只是做些实验性的工作。利用JNI，为Spark-0.6.0开发了一点点C++ API，目前能成功运行wordcount，kmeans，还在开发中，一些环境变量的配置没有更改，如有想下载运行的话，可能要花点时间配置一下。以后还会继续更新，等到一些配置好了，会更新通知。 Tips 本项目已放弃，不再更新 Contact e-mail：

spark_API文档

4星 · 用户满意度95%

为了方便学习，wget了spark的api，有需要的可下载参考。

SparkDemo.rar

本例子包括spark count,sparksql,sparkstreaming的样例，本例子包括spark count,sparksql,sparkstreaming的样例，

Spark 2.1.0 API(java).chm

3星 · 编辑精心推荐

最新版spark2.1.0 java api。如果觉得好，就给个评论，谢谢！！

Spark 1.6.0 API CHM

4星 · 用户满意度95%

自己下载的Spark 1.6.0 API 文档，编译生成的CHM版本文档

Spark python API 函数调用学习

关于Spark Python API函数调用学习的一些资料，内含代码；对于正在用python做大数据分布式的小伙伴会有帮助。

Spark2.2Doc API 中文参考文档

5星 · 资源好评率100%

Spark 2.2.x Doc API 中文参考文档， Spark Shell 提供了一种简单的方式来学习 Spark API，同时它也是一个强大的交互式数据分析工具。Spark Shell 既支持 Scala(Scala 运行在 Java 虚拟机上，所以可以很方便的引用...

spark 2.0 javaAPI

spark的javaAPI开发文档，只不过是英文版的。没有做翻译工作。希望对下载人员有帮助。

Spark 1.0.2 API (Scala)

5星 · 资源好评率100%

spark 1.0.2 API,Scala版，英文

spark-scala-api

5星 · 资源好评率100%

spark-scala-api zip压缩包

spark2.1.0 JAVA API

spark 通过java操作的API详细说明，chm格式，可搜索自己想要的API，内部有详细的用法说明

spark mllib 常用的自学demo

免费下载Navicat15安装包+工具+教程.zip

3星 · 编辑精心推荐

Navicate Premium 15 安装包+工具+教程

人大金仓驱动包kingbasejdbc.jar V8.6.0、8.8.0驱动jar包

5星 · 资源好评率100%

kingbase JDBC 8.6.0 驱动jar包 kingbase JDBC 8.8.0 驱动jar包 maven 导入 <dependency> <groupId>com.kingbase8.jdbc</groupId> <artifactId>kingbase8</artifactId> <version>8.6.0</version> <scope>system<

全国省市县Excel汇总表（免费下载）.xls

5星 · 资源好评率100%

全国所有省份、城市、区县的Excel汇总表（按首字母进行排序），包含了各市的下辖区和县，信息比较详细。

OBCA最新题库（包括单选，多选和判断）

5星 · 资源好评率100%

适用于要考OBCA的人群，或者对OceanBase感兴趣的程序猿涉及到的知识面比较广，且对每个题进行了解析

1、hello world
val sc = SparkContext("Spark://localhost:7077","Hello world","SPARK_HOME","YOUR_APP_JAR")
val file = sc.textFile("hdfs://")
val filterRDD = file.filter(_contains("Hello World"))
filterRDD.cache()
filterRDD.count()

2、RDD分区
val rdd = sc.parallelize(1 to 100,2)
rdd.partitions.size
val rdd = sc.parallelize(1 to 100)
rdd.partitions.size

3、RDD优先位置
val rdd = sc.textFile(hdfs:10.0.2.19:9000/bigfile)
val hadoopRDD = rdd.dependencies(0).rdd
hadoopRDD.partitions.size
hadoopRDD.preferredLocations(hadoopRDD.partitions(0))

4、RDD的依赖关系
val rdd = sc.makeRDD(1 to 10)
val mapRDD = rdd.map(x => (x,x))
mapRDD.dependencies
val shuffleRDD = mapRDD.partitionBy(new org.apache.spark.HashPartitioner(3)) ？？？？？
shuffleRDD.dependencies

5、PageRank
val links = sc.parallelize(Array(('A',Array('D')),('B',Array('A')),('C',Array('A','B')),('D',Array('A','B'))),2)
.map(x =>(x._1,x._2)).cache()
val ranks = sc.parallelize(Array(('A',1.0),('B',1.0),('C',1.0),('D',1.0)),2)

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余4页未读，立即下载

评论收藏

内容反馈

资源评论