Spark全栈数据分析
作者:(美)罗素·朱尼
出版社:电子工业出版社
ISBN:9787121351662
VIP会员免费
(仅需0.8元/天)
¥ 39.6
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
Spark高级数据分析(中文完整pdf版) 评分:
本书是由著名大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Spark和Scala进行数据处理的基础知识,接着讨论了如何将Spark用于机器学习,同时介绍了常见应用中几个最常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询Wikipedia或分析基因数据。
上传时间:2017-01 大小:18.15MB
- 63.92MB
Scala和Spark大数据分析函数式编程、数据流和机器学习
2022-04-23Scala和Spark大数据分析函数式编程、数据流和机器学习
- 11.32MB
Spark 编程指南简体中文版.pdf
2021-11-23Spark 编程指南简体中文版
- 1.27MB
8.SparkMLlib(下)--SparkMLlib实战.pdf
2018-04-041.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL(上)--SparkSQL简介.pdf 6.SparkSQL(下)--Spark实战应用.pdf 6.SparkSQL(中)--深入了解运行计划及调优.pdf 7.SparkStreaming(上)--SparkStreaming原理介绍.pdf 7.SparkStreaming(下)--SparkStreaming实战.pdf 8.SparkMLlib(上)--机器学习及SparkMLlib简介.pdf 8.SparkMLlib(下)--SparkMLlib实战.pdf 9.SparkGraphX介绍及实例.pdf 10.分布式内存文件系统Tachyon介绍及安装部署.pdf
- 2.60MB
spark官方文档中文版.pdf
2018-01-10spark官方文档中文版.pdf !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1111111111111111
- 29.64MB
Scala Spark pdf文档大合集,大数据就看这些
2015-09-11学习Spark技术相关文档,包括Scala由浅入深,及Spark详细介绍实践等文档,主要都是文字版,对大数据感兴趣的应该不会失望,包含Scala in Action; Learning Spark; Scala in Depth;Scala for the Impatient;Spark快速数据处理等,不过大部分为英文,请慎重。
- 7.16MB
spark 高级数据分析
2018-06-11大数据是这几年科技和应用领域炙手可热的话题,而Spark 又是大数据领域里最活跃的技 术。对Spark 这个技术,国内研究比较多的是原理和源代码,...可以说,本书的出版将为Spark 数据分析 项目的落地起到巨大的推动作用。
- 16.13MB
Spark 快速大数据分析
2018-08-12Spark 快速大数据分析Spark 快速大数据分析Spark 快速大数据分析Spark 快速大数据分析Spark 快速大数据分析Spark 快速大数据分析
- 70.58MB
spark高级分析数据源码
2018-06-18spark高级分析数据源码,这本书的事例代码都在这里面。在你学习的时候可以下下来查看交流
- 3KB
Spark大数据分析与实战课后练习答案.rar
2022-06-22Spark大数据分析与实战课后练习答案.rar
- 46.9MB
Spark大数据处理技术、应用与性能优化高清完整版PDF
2017-12-22Spark大数据处理:技术、应用与性能优化高清完整版PDF
- 328B
Spark大数据分析技术_网盘链接下载15.69M
2018-08-20Spark大数据分析技术,是一本为Spark初学者准备的书,没有过多深入实现细节,而更多关注上层用户的具体用法。尝试把spark应用到实践中,去探寻数据海洋里的无尽瑰宝。主要内容如下: 1)Spark数据分析导论 2)Spark下载与入门 3)RDD编程 4)键值对操作 5)数据读取与保存 6)Spark编程进阶 7)在集群上运行的Spark 8)Spark调优与调试 9)SparkSQL 10)Spark Streaming 11)基于MLlib的机器学习
- 1.90MB
Hbase框架原理和开发指导-基础篇.docx
2020-04-27详细介绍了hbase的框架结构,运行原理,环境搭建,shell命令,java开发和接口集成。循序渐进,由浅入深,描述非常清晰,非常适合Hbase爱好者构建基础知识体系。内容包括四大部分:1.HBase组件和运行原理 2.环境搭建 3.shell命令和java开发。4.Hbase集成篇:与hive集成,与sqoop集成
- 280.87MB
Spark-权威指南:Spark:权威指南的代码存储库
2021-02-27Spark:权威指南 这是与相关的所有材料的中央资料库 Bill Chambers和Matei Zaharia撰写。 这个资料库目前仍在进行中,随着时间的推移会增加新的资料。 书中的代码 您可以从code子文件夹的书中找到代码,在该code中,可以按语言和章节对code进行细分。 如何运行代码 在本地计算机上运行 要在本地计算机上运行该示例,请将data子文件夹中的所有数据拉到计算机上的/data或指定本地计算机上该特定数据集的路径。 在Databricks上运行 要在Databricks上运行这些模块,您将需要做两件事。 注册新账号。 你可以在做。 导入单个笔记本以在平台上运行 Databricks是一个零管理云平台,可提供: 完全托管的Spark集群 一个用于探索和可视化的交互式工作区 生产管道调度程序 一个为您喜欢的基于Spark的应用程序提供动力的平台 导入说明 导航到您要
- 7.87MB
Spark使用指南(权威版)
2018-10-10权威版 Spark使用指南,Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎;Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
- 4.31MB
Spark编程指南中文版
2016-08-10Spark编程指南中文版 包括pdf,mobi,epub三种版本,简体中文
- 688.15MB
aasPractice:《spark高级数据分析》练习
2021-05-14《Spark 高级数据分析》练习
- 14.62MB
Spark官方文档指南chm版本
2020-12-15Spark官方文档离线版,无法连接外部网络的同事可以查看,内包含Spark官方使用用例,Scala 与 Java API手册
- 107.78MB
Hadoop权威指南 第3版.pdf 清晰中文完整版
2019-04-24《Hadoop权威指南(第3版)》通过丰富的案例学习来解释Hadoop的幕后机理,阐述了Hadoop如何解决现实生活中的具体问题。第3版覆盖Hadoop的最新动态,包括新增的MapReduceAPI,以及MapReduce2及其灵活性更强的执行模型(YARN)。
- 32.7MB
Spark入门(完整版)
2018-04-03Spark入门完整版 PDF版,从生态圈 部署安装 编程模型 运行框架 stream sql mllib graphx tachyon安装部署介绍
- 8.30MB
Spark In Action.pdf
2018-07-03Spark In Action Spark In Action Spark In Action Spark In Action
- 2.13MB
spark1.4.pdf
2018-11-08spark开发文档,有需要的尽管下载看看,1分而已,哈哈哈
- 6.88MB
Learning Spark pdf
2018-02-24spark的一本电子书籍,学习spark还不错的资料,可以下载看看,学习一下。
- 2.28MB
spark详解 PDF 下载
2019-06-11spark详解
- 32.4MB
Spark 入门实战系列
2018-01-18Spark 入门实战系列,适合初学者,文档包括十部分内容,质量很好,为了感谢文档作者,也为了帮助更多的人入门,传播作者的心血,特此友情转贴: 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL(上)--SparkSQL简介.pdf 6.SparkSQL(下)--Spark实战应用.pdf 6.SparkSQL(中)--深入了解运行计划及调优.pdf 7.SparkStreaming(上)--SparkStreaming原理介绍.pdf 7.SparkStreaming(下)--SparkStreaming实战.pdf 8.SparkMLlib(上)--机器学习及SparkMLlib简介.pdf 8.SparkMLlib(下)--SparkMLlib实战.pdf 9.SparkGraphX介绍及实例.pdf 10.分布式内存文件系统Tachyon介绍及安装部署.pdf
- 1.41MB
Spark V3.0 概述.pdf
2021-07-01Spark V3.0 概述
- 32.43MB
Spark入门实战系列 超清自解压 PDF文件
2020-09-10spark入门级资料推荐,开始是介绍简装 编译运行等基础介绍,从第五章开始 Hive介绍及部署 Hive实战 SparkSQL介绍 实战 深入了解运行计划及调优 SparkStreaming原理介绍 实战 SparkMLlib机器学习及SparkMLlib简介 实战 SparkGraphX介绍及实例 分布式内存文件系统Tachyon介绍及安装部署
- 13.6MB
Spark2018eBook.pdf
2019-03-06Spark2018eBook.pdf
- 71.0MB
自然语言处理和模式识别.zip
2019-07-27这套资源包含了一些经典的自然语言处理方法和模型识别。可以帮助那些想要从事和实践这一块的人更好的掌握这些方法
- 9.37MB
learning-pyspark.pdf
2019-05-27Learning pyspark It is estimated that in 2013 the whole world produced around 4.4 zettabytes of data; that is, 4.4 billion terabytes! By 2020, we (as the human race) are expected to produce ten times that. With data getting larger literally by the second, and given the growing appetite for making sense out of it, in 2004 Google employees Jeffrey Dean and Sanjay Ghemawat published the seminal paper MapReduce: Simplified Data Processing on Large Clusters. Since then, technologies leveraging the concept started growing very quickly with Apache Hadoop initially being the most popular. It ultimately created a Hadoop ecosystem that included abstraction layers such as Pig, Hive, and Mahout – all leveraging this simple concept of map and reduce.
- 5.70MB
pyspark资源整理
2018-08-09最近在使用spark的过程中,发现自己对spark的包了解的不够,网上查也是这一点那一点的,所以自己整理的一张脑图,然后做了些实验,记录下来,上传到CSDN上需要的自取