从零开始学Hadoop大数据分析(视频教学版)
电子书推荐
-
大数据Spark企业级实战版_带书签_高清完整版.pdf 评分:
【更多关于《Spark》资料,加qq群:931257845领取!】 Spark是当今大数据领域最活跃、最热门、最高效的大数据通用计算平台,是Apache软件基金会下所有开源项目中三大顶级开源项目之一。 《大数据Spark企业级实战》详细解析了企业级Spark开发所需的几乎所有技术内容,涵盖Spark的架构设计、Spark的集群搭建、Spark内核的解析、Spark SQL、MLLib、GraphX、Spark Streaming、Tachyon、SparkR、Spark多语言编程、Spark常见问题及调优等,并且结合Spark源码细致的解析了Spark内核和四大子框架,最后在附录中提供了的Spark的开发语言Scala快速入门实战内容,学习完此书即可胜任绝大多数的企业级Spark开发需要。
上传时间:2018-03 大小:114.49MB
- 87B
Spark大数据商业实战三部曲:内核解密|商业案例 1.22G
2018-12-11Spark大数据商业实战三部曲:内核解密|商业案例 1.22G
- 10.27MB
spark大数据商业实战三部曲源码及资料.zip
2019-08-09spark大数据商业实战三部曲源码及资料,包含书中各个章节所用到的文件、资料、代码
- 114.49MB
大数据spark企业级实战 完整版
2018-09-04在学习了基础知识之后,感觉缺少点东西作为练习。这个可以作为一种考虑。
- 152.56MB
Scala编程完整版+大数据Spark企业级实战版
2018-09-27大数据Spark企业级实战版,本书介绍了一种新的编程语言---Scala,它把面向对象和函数式编程有机的结合为整体,从而形成一种统一,语义丰富新思维体系。
- 114.57MB
大数据Spark企业级实战版.pdf
2018-02-27park是当今大数据领域最活跃、最热门、最高效的大数据通用计算平台,是Apache软件基金会下所有开源项目中三大顶级开源项目之一。 在“One Stack to rule them all”理念的指引下,Spark基于RDD成功地构建起了大数据处理的一体化解决方案,将MapReduce、Streaming、SQL、Machine Learning、Graph Processing等大数据计算模型统一到一个技术堆栈中,开发者使用一致的API操作Spark中的所有功能;更为重要的是Spark的Spark SQL、MLLib、GraphX、Spark Streaming等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了Spark在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得Spark正在加速成为大数据处理中心首选的和唯一的计算平台。
- 111.9MB
大数据Spark企业级实战版
2017-12-01大数据Spark企业级实战版 带书签
- 114.30MB
Spark大数据企业级实战版_带目录
2018-08-15Spark大数据企业级实战版_带目录.pdf Spark大数据企业级实战版_带目录.pdf Spark大数据企业级实战版_带目录.pdf
- 52.45MB
《大数据Spark企业级实战版》2
2017-05-23大数据领域必读!此文件为第二分卷。
- 110.66MB
大数据Spark企业级实战
2019-03-20大数据Spark企业级实战,PDF电子版,带书签,非常清晰喔~
- 8.94MB
大数据Spark企业级实战版part2
2016-12-10大数据Spark企业级实战版这个资源太大,此为第二部分
- 110.69MB
大数据Spark企业级实战版 - 王家林
2018-06-06《大数据Spark企业级实战》详细解析了企业级Spark开发所需的几乎所有技术内容,涵盖Spark的架构设计、Spark的集群搭建、Spark内核的解析、Spark SQL、MLLib、GraphX、Spark Streaming、Tachyon、SparkR、Spark多语言编程、Spark常见问题及调优等,并且结合Spark源码细致的解析了Spark内核和四大子框架,最后在附录中提供了的Spark的开发语言Scala快速入门实战内容,学习完此书即可胜任绝大多数的企业级Spark开发需要。 《大数据Spark企业级实战》从零起步,完全从企业处理大数据业务场景的角度出发,基于实战代码来组织内容,对于一名大数据爱好者来说,《大数据Spark企业级实战》内容可以帮助您一站式地完成从零起步到进行Spark企业级开发所需要的全部核心内容和实战需要。
- 76B
Spark内核剖析+调优全套教程 附课件、代码、资料
2018-02-28Spark内核深度剖析 Spark调优 SparkSQL精讲 SparkStreaming精讲 Spark2新特性
- 175.66MB
《大数据开发工程师系列:Hadoop & Spark大数据开发实战》.pdf
2019-05-23《大数据开发工程师系列:Hadoop & Spark大数据开发实战》
- 265B
一个很牛逼的spark项目连接
2018-10-10这个项目涵盖了javaweb和大数据生态圈的一些技术,对从共享单车的初始页面和充值页面和扫码页面进行讲述,通过大数据技术对车子进行定位和推荐很全的一个项目
- 35.8MB
Spark机器学习案例实战.pdf
2021-07-25大数据培训期间,课堂教材
- 13.93MB
大数据Spark企业级实战版.zip.003
2017-09-04大数据Spark企业级实战版.zip.003 大数据Spark企业级实战版.zip.003
- 113.93MB
大数据Spark企业级实战版-版本2015年1月.pdf
2018-03-15大数据Spark企业级实战版-版本2015年1月.pdf大数据Spark企业级实战版-版本2015年1月.pdf
- 139.50MB
大数据Spark:企业级实战
2018-12-05大数据Spark:企业级实战
- 50.0MB
大数据Spark企业级实战版.zip.001
2017-09-04大数据Spark企业级实战版.zip.001 共3份
- 50.0MB
大数据Spark企业级实战版.zip.002
2017-09-04共3份 大数据Spark企业级实战版.zip.002
- 772KB
基于Spark可视化大数据挖掘平台_李文.pdf
2016-01-15基于Spark可视化大数据挖掘平台,
- 8.84MB
Spark in Action 无水印原版pdf
2018-04-25Spark in Action 英文无水印原版pdf pdf所有页面使用FoxitReader、PDF-XChangeViewer、SumatraPDF和Firefox测试都可以打开 本资源转载自网络,如有侵权,请联系上传者或csdn删除 查看此书详细信息请在美国亚马逊官网搜索此书
- 178.74MB
Spark2.0.2 安装包
2018-02-24spark安装包,亲测有效。
- 14.54MB
Spark 2.x Cookbook 高清原版 pdf
2018-05-08spark 2.0;spark;大数据;分布式计算框架;高清原版pdf
- 62B
Spark 2.0.2 Spark 2.2 中文文档 本资源为网页,不是PDF
2017-12-07本资源为网页,不是PDF Apache Spark 2.0.2 中文文档 Spark 概述 编程指南 快速入门 Spark 编程指南 概述 Spark 依赖 Spark 的初始化 Shell 的使用 弹性分布式数据集(RDDS) 并行集合 外部数据集 RDD 操作 RDD 持久化 共享变量 Broadcast Variables (广播变量) Accumulators (累加器) 部署应用到集群中 使用 Java / Scala 运行 spark Jobs 单元测试 Spark 1.0 版本前的应用程序迁移 下一步 Spark Streaming Spark Streaming 概述 一个简单的示例 基本概念 依赖 初始化 StreamingContext Discretized Streams(DStreams)(离散化流) Input DStreams 和 Receivers DStreams 上的 Transformations(转换) DStreams 上的输出操作 DataFrame 和 SQL 操作 MLlib 操作 缓存 / 持久化 CheckPointing 累加器和广播变量 应用程序部署 监控应用程序 性能 降低批处理的时间 设置合理的批处理间隔 内存 容错语义 迁移指南(从 0.9.1 或者更低版本至 1.x 版本) 快速跳转 Kafka 集成指南 DataFrames,Datasets 和 SQL Spark SQL 概述 SQL Datasets 和 DataFrames Spark SQL 入门指南 起始点 : SparkSession 创建 DataFrame 无类型 Dataset 操作(aka DataFrame 操作) 以编程的方式运行 SQL 查询 创建 Dataset RDD 的互操作性 数据源 通用的 Load/Save 函数 Parquet文件 JSON Datasets Hive 表 JDBC 连接其它数据库 故障排除 性能调优 缓存数据到内存 其它配置选项 分布式 SQL引擎 运行 Thrift JDBC/ODBC 运行 Spark SQL CLI 迁移指南 从 Spark SQL 1.6 升级到 2.0 从 Spark SQL 1.5 升级到 1.6 从 Spark SQL 1.4 升级到 1.5 从 Spark SQL 1.3 升级到 1.4 从 Spark SQL 1.0~1.2 升级到 1.3 兼容 Apache Hive 参考 数据类型 NaN 语义 Structured Streaming MLlib(机器学习) 机器学习库(MLlib)指南 ML Pipelines(ML管道) Extracting, transforming and selecting features(特征的提取,转换和选择) Classification and regression(分类和回归) Clustering(聚类) Collaborative Filtering(协同过滤) ML Tuning: model selection and hyperparameter tuning(ML调优:模型选择和超参数调整) Advanced topics(高级主题) MLlib:基于RDD的API Data Types - RDD-based API(数据类型) Basic Statistics - RDD-based API(基本统计) Classification and Regression - RDD-based API(分类和回归) Collaborative Filtering - RDD-based API(协同过滤) Clustering - RDD-based API(聚类 - 基于RDD的API) Dimensionality Reduction - RDD-based API(降维) Feature Extraction and Transformation - RDD-based API(特征的提取和转换) Frequent Pattern Mining - RDD-based API(频繁模式挖掘) Evaluation metrics - RDD-based API(评估指标) PMML model export - RDD-based API(PMML模型导出) Optimization - RDD-based API(最) GraphX(图形处理) Spark R 部署 集群模式概述 提交应用 Spark Standalone 模式 Spark on Mesos Spark on YARN Spark on YARN 上运行 准备 Spark on YARN 配置 调试应用 Spark 属性 重要提示 在一个安全的集群中运行 用 Apache Oozie 来运行应用程序 Kerberos 故障排查 Spark 配置 Spark 监控 指南 作业调度 Spark 安全 硬件配置 构建 Spark
- 213.28MB
Spark大数据商业实战三部曲_内核解密_商业案例_性能调优(200MB版)
2019-03-12Spark大数据商业实战三部曲_内核解密_商业案例_性能调优(200MB版)
- 58KB
大数据Spark企业级实战书籍推荐.docx
2022-10-20大数据Spark企业级实战书籍推荐.docx大数据Spark企业级实战书籍推荐.docx
- 496KB
Spark实战.docx
2018-06-011. Spark是特性 高可伸缩性 高容错 于内存计算 2. Spark的生态体系(BDAS,中文:伯利克分析栈) MapReduce属于Hadoop生态体系之一,Spark则属于BDAS生态体系之一 Hadoop包含了MapReduce、HDFS、HBase、Hive、Zookeeper、Pig、Sqoop等 BDAS包含了Spark、Shark(相当于Hive)、BlinkDB、Spark Streaming(消息实时处理框架,类似Storm)等等 3. Spark与MapReduce 优势: MapReduce通常将中间结果放到HDFS上,Spark是基于内存并行大数据框架,中间结果存放到内存,对于迭代数据Spark效率高。 MapReduce总是消耗大量时间排序,而有些场景不需要排序,Spark可以避免不必要的排序所带来的开销 Spark是一张有向无环图(从一个点出发最终无法回到该点的一个拓扑),并对其进行优化。 4. Spark支持的API Scala、Python、Java等 5. 运行模式 Local (用于测试、开发) Standlone (独立集群模式) Spark on Yarn (Spark在Yarn上) Spark on Mesos (Spark在Mesos)
- 46.9MB
Spark大数据处理技术、应用与性能优化高清完整版PDF
2017-12-22Spark大数据处理:技术、应用与性能优化高清完整版PDF
- 219.82MB
spark大数据商业实战三部曲完整版
2019-04-15spark大数据商业实战三部曲完整版,绝对完整!包含后面的13章带目录,并且对每个目录做了准确的目标位置,其它网友上传的只要前18章,内容不全,为此,本人在阅读的过程中亲自整理了笔记,并做上了重点标记,方便读者阅读