已选条件 :  
img
Spark: The Definitive Guide by Matei Zaharia, Bill Chambers

了解如何使用,部署和维护Apache Spark,该指南由该开放源代码集群计算框架的创建者撰写。作者Bill Chambers和Matei Zaharia强调Spark 2.0中的改进和新功能,将Spark主题分为不同的部分,每个部分都有独特的目标。您将探索Spark的结构化API的基本操作和常用功能,以及构建端到端流应用程序的新型高级API结构化流。 Spark的开发人员和系统管理员将会学习Sp

img
Spark学习笔记

spark 可以很容易和yarn结合,直接调用HDFS、Hbase上面的数据,和hadoop结合。配置很容易。 spark发展迅猛,框架比hadoop更加灵活实用。减少了延时处理,提高性能效率实用灵活性。也可以与hadoop切实相互结合。 spark核心部分分为RDD。Spark SQL、Spark Streaming、MLlib、GraphX、Spark R等核心组件解决了很多的大数据问题,

img
Spark学习总结-入门

Spark是一个高效的分布式计算系统,发源于美国加州大学伯克利分校AMPLab的集群计算平台。Spark立足于内存计算,相比Hadoop MapReduce,Spark在性能上要高100倍,而且Spark提供了比Hadoop更上层的API,同样的算法在Spark中实现往往只有Hadoop的1/10或者1/100的长度。

img
图解Spark 核心技术与案例实战-pdf

本书以Spark 2.0 版本为基础进行编写,全面介绍了Spark 核心及其生态圈组件技术。主要内容包括Spark 生态圈、实战环境搭建、编程模型和内部重要模块的分析,重点介绍了消息通信框架、作业调度、容错执行、监控管理、存储管理以及运行框架,同时还介绍了Spark 生态圈相关组件,包括了Spark SQL 的即席查询、Spark Streaming 的实时流处理应用、MLbase/MLlib 的

img
Spark大数据处理:技术、应用与性能优化

Spark大数据处理:技术、应用与性能优化》根据最新技术版本,系统、全面、详细讲解Spark的各项功能使用、原理机制、技术细节、应用方法、性能优化,以及BDAS生态系统的相关技术。, 作为一个基于内存计算的大数据并行计算框架,Spark不仅很好地解决了数据的实时处理问题,而且保证了高容错性和高可伸缩性。具体来讲,它有如下优势:, 打造全栈多计算范式的高效数据流水线, 轻量级快速处理, 易于使用,

img
spark 框架word count scala源文件

spark 框架word count scala源文件 spark 框架word count scala源文件spark 框架word count scala源文件spark 框架word count scala源文件spark 框架word count scala源文件

img
Advanced_Analytics_with_Spark

In the second edition of this practical book, four Cloudera data scientists present a set of self-contained patterns for performing large-scale data analysis with Spark. The authors bring Spark, stati

img
深入理解Spark+核心思想与源码分析.pdf

深入理解Sp深入理解SPARK:核心思想与源码分析》结合大量图和示例,对Spark的架构、部署模式和工作模块的设计理念、实现源码与使用技巧进行了深入的剖析与解读。 《深入理解SPARK:核心思想与源码分析》一书对Spark1.2.0版本的源代码进行了全面而深入的分析,旨在为Spark的优化、定制和扩展提供原理性的指导。阿里巴巴集团专家鼎力推荐、阿里巴巴资深Java开发和大数据专家撰写。ark+核心

img
图灵程序设计丛书 Spark快速大数据分析 pdf

大数据是近几年广受关注的一个概念。今天,互联网不断发展,逐渐深入我们生活的各个层面,随之而来的是数据量的指数级增长。很久以前,人类就学会了通过分析数据获取有价值的结论。有时,影响结论的因素过多,采样的数据无法有效保留所有因素的影响,得出的结论就不够有效。如果不使用采样,而原始数据规模巨大,我们就需要改进数据处理的手段。从人工统计到利用一些传统的计算机软件进行分析,再到MapReduce 模型,随着

img
Frank Kane's Taming Big Data with Apache Spark and Python 【含代码】

Frank Kane's Taming Big Data with Apache Spark and Python English | 2017 | ISBN-10: 1787287947 | 296 pages | AZW3/PDF/EPUB (conv) | 6.12 Mb Key Features Understand how Spark can be distributed across

资源排行