下载 > 资源分类 >  大数据 >  spark > Spark 2.0.2 Spark 2.2 中文文档

Spark 2.0.2 Spark 2.2 中文文档

2017-12-07 上传大小:62B

本资源为网页,不是PDF 
Apache Spark 2.0.2 中文文档
    Spark 概述
    编程指南
        快速入门
        Spark 编程指南
            概述
            Spark 依赖
            Spark 的初始化
                Shell 的使用
            弹性分布式数据集(RD
DS)
                并行集合
                外部数据集
                RDD 操作
                RDD 持久化
            共享变量
                Broadcast Variables (广播变量)
                Accumulators (累加器)
            部署应用到集群中
            使用 Java / Scala 运行 spark Jobs
            单元测试
            Spark 1.0 版本前的应用程序迁移
            下一步
        Spark Streaming
            Spark Streaming 概述
            一个简单的示例
            基本概念
                依赖
                初始化 StreamingContext
                Discretized Streams(DStreams)(离散化流)
                Input DStreams 和 Receivers
                DStreams 上的 Transformations(转换)
                DStreams 上的输出操作
                DataFrame 和 SQL 操作
                MLlib 操作
                缓存 / 持久化
                CheckPointing
                累加器和广播变量
                应用程序部署
                监控应用程序
            性能优化
                降低批处理的时间
                设置合理的批处理间隔
                内存优化
            容错语义
            迁移指南(从 0.9.1 或者更低版本至 1.x 版本)
            快速跳转
                Kafka 集成指南
        DataFrames,Datasets 和 SQL
            Spark SQL 概述
                SQL
                Datasets 和 DataFrames
            Spark SQL 入门指南
                起始点 : SparkSession
                创建 DataFrame
                无类型 Dataset 操作(aka DataFrame 操作)
                以编程的方式运行 SQL 查询
                创建 Dataset
                RDD 的互操作性
            数据源
                通用的 Load/Save 函数
                Parquet文件
                JSON Datasets
                Hive 表
                JDBC 连接其它数据库
                故障排除
            性能调优
                缓存数据到内存
                其它配置选项
            分布式 SQL引擎
                运行 Thrift JDBC/ODBC server
                运行 Spark SQL CLI
            迁移指南
                从 Spark SQL 1.6 升级到 2.0
                从 Spark SQL 1.5 升级到 1.6
                从 Spark SQL 1.4 升级到 1.5
                从 Spark SQL 1.3 升级到 1.4
                从 Spark SQL 1.0~1.2 升级到 1.3
                兼容 Apache Hive
            参考
                数据类型
                NaN 语义
        Structured Streaming
        MLlib(机器学习)
            机器学习库(MLlib)指南
                ML Pipelines(ML管道)
                Extracting, transforming and selecting features(特征的提取,转换和选择)
                Classification and regression(分类和回归)
                Clustering(聚类)
                Collaborative Filtering(协同过滤)
                ML Tuning: model selection and hyperparameter tuning(ML调优:模型选择和超参数调整)
                Advanced topics(高级主题)
            MLlib:基于RDD的API
                Data Types - RDD-based API(数据类型)
                Basic Statistics - RDD-based API(基本统计)
                Classification and Regression - RDD-based API(分类和回归)
                Collaborative Filtering - RDD-based API(协同过滤)
                Clustering - RDD-based API(聚类 - 基于RDD的API)
                Dimensionality Reduction - RDD-based API(降维)
                Feature Extraction and Transformation - RDD-based API(特征的提取和转换)
                Frequent Pattern Mining - RDD-based API(频繁模式挖掘)
                Evaluation metrics - RDD-based API(评估指标)
                PMML model export - RDD-based API(PMML模型导出)
                Optimization - RDD-based API(最优化)
        GraphX(图形处理)
        Spark R
    部署
        集群模式概述
        提交应用
        Spark Standalone 模式
        Spark on Mesos
        Spark on YARN
            Spark on YARN 上运行
            准备
            Spark on YARN 配置
            调试应用
            Spark 属性
            重要提示
            在一个安全的集群中运行
            用 Apache Oozie 来运行应用程序
            Kerberos 故障排查
    更多
        Spark 配置
        Spark 监控
        优化指南
        作业调度
        Spark 安全
        硬件配置
        构建 Spark
...展开收缩
综合评分:0(0位用户评分)
开通VIP C币充值 立即下载

评论共有0条

登录后才能评论

 

相关推荐

Apache Spark 2.0.2 中文文档 立即下载
积分/C币:12
Apache Spark 2.0.2 官方中文手册 立即下载
积分/C币:12
spark2.0.2最新scalaAPI文档 立即下载
积分/C币:5
spark 中文 文档 立即下载
积分/C币:10
spark 中文文档 立即下载
积分/C币:10
spark 高可用安装文档 立即下载
积分/C币:0
spark官方文档中文版 立即下载
积分/C币:12
Spark-Bench使用文档 立即下载
积分/C币:5
Spark官方文档翻译 立即下载
积分/C币:10
spark官方文档 立即下载
积分/C币:0
spark_API文档 立即下载
积分/C币:5
即时通讯配置文档 OpenFire&Spark&MySQL 立即下载
积分/C币:0
hadoop+hive+spark部署文档 立即下载
积分/C币:3
Spark皮肤相关文档 立即下载
积分/C币:3
Spark Standalone 官方文档翻译 立即下载
积分/C币:3
Hadoop及Spark集群搭建文档 立即下载
积分/C币:3
Spark大数据中文分词统计Scala语言工程源码 立即下载
积分/C币:11
Android2.2 r1 API中文文档——RadioButton(完成).doc 立即下载
积分/C币:0
Android2.2 API 中文文档系列(4) —— Manifest 立即下载
积分/C币:3
Android 2.2 r1 API 中文文档系列(12) —— Button 立即下载
积分/C币:3
img
huoyongjie698

关注

等级:1积分 2

上传者其他资源上传者专辑

VIP会员动态

关闭
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
扫码关注并点击右下角获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

Spark 2.0.2 Spark 2.2 中文文档

会员到期时间: 剩余下载个数: 剩余C币:593 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
(仅够下载10个资源)
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
为了良好体验,不建议使用迅雷下载
C币充值 开通VIP
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可奖励5下载分

  • 举报人:
  • 被举报人:
  • 举报的资源分:
  • *类型:
  • *详细原因: