Spark Streaming实时流式大数据处理实战
电子书推荐
-
Spark大数据商业实战三部曲:内核解密 商业案例 性能调优(完整版 高清 内容可复制) 评分:
Spark大数据商业实战三部曲:内核解密 商业案例 性能调优(完整版 高清 内容可复制) 花大洋买的,赶紧下载吧
上传时间:2018-09 大小:64B
- 213.28MB
Spark大数据商业实战三部曲_内核解密_商业案例_性能调优(200MB版)
2019-03-12Spark大数据商业实战三部曲_内核解密_商业案例_性能调优(200MB版)
- 219.82MB
spark大数据商业实战三部曲完整版
2019-04-15spark大数据商业实战三部曲完整版,绝对完整!包含后面的13章带目录,并且对每个目录做了准确的目标位置,其它网友上传的只要前18章,内容不全,为此,本人在阅读的过程中亲自整理了笔记,并做上了重点标记,方便读者阅读
- 87B
Spark大数据商业实战三部曲:内核解密|商业案例 1.22G
2018-12-11Spark大数据商业实战三部曲:内核解密|商业案例 1.22G
- 10.27MB
spark大数据商业实战三部曲源码及资料.zip
2019-08-09spark大数据商业实战三部曲源码及资料,包含书中各个章节所用到的文件、资料、代码
- 1.23MB
Spark大数据商业实战三部曲_内核解密_商业案例_性能调优
2019-01-051.2个G的Spark大数据商业实战三部曲_内核解密_商业案例_性能调优PDF文档,找了好久 快来抢呀过几天就下架了,链接失效联系我
- 10.21MB
Spark大数据商业实战三部曲_内核解密_商业案例_性能调优 实例源码
2019-04-09Spark大数据商业实战三部曲_内核解密_商业案例_性能调优 实例源码
- 116B
spark商业实战三部曲
2019-01-03基于*的Spark2.2.X版本,分为内核解密篇,商业案例篇,性能调优篇,共31章,学习过程中有任何疑问,可加入群,有专业人员答疑解惑。 目 录 上篇 内核解密 章 电光石火间体验Spark 2.2开发实战... 2 1.1 通过RDD...
- 17.54MB
code-of-spark-big-data-business-trilogy:这是书“ Spark大数据业务三部曲”的代码
2021-05-06Spark 大数据商业实战三部曲:内核解密|商业案例|性能调优第二版王家林,段智华着基于最新的Spark2.4.X版本,分为内核解密篇,商业案例篇,性能调优篇和Spark+AI解密篇,共32章,学习过程中有任何疑问,可加入QQ群...
- 4.92MB
电光石火间体验Spark 3.0开发实战
2021-06-22在大数据和AI紧密协同时代,最佳的AI系统依赖海量数据才能构建出高度复杂的模型,海量数据需要借助Al才能挖掘出终极...本课程基于《Spark大数据商业实战三部曲》第二版,以Spark 3.0新版本为载体,讲解第一章的内容。
- 3.16MB
Spark 3.0技术及原理
2021-06-22在大数据和AI紧密协同时代,最佳的AI系统依赖海量数据才能构建出高度复杂的模型,海量数据需要借助Al才能挖掘出终极...本课程参考《Spark大数据商业实战三部曲》第二版,以Spark 3.0新版本为载体,讲解第二章的内容。
- 10.21MB
Spark商业实战三部曲源码
2019-03-17Spark商业实战三部曲源码,包含书中所用到的代码以及用到的数据集
- 76B
Spark内核剖析+调优全套教程 附课件、代码、资料
2018-02-28Spark内核深度剖析 Spark调优 SparkSQL精讲 SparkStreaming精讲 Spark2新特性
- 59.33MB
大数据应用 商业案例实践
2018-02-24扫描完整版带书签 无广告! 大数据应用 商业案例实践 大数据应用 商业案例实践
- 2.76MB
《基于OpenStack Docker打造Spark大数据服务》 PDF
2018-08-29《基于OpenStack Docker打造Spark大数据服务》
- 822KB
Spark性能调优分享
2017-12-29我们谈大数据性能调优,到底在谈什么,它的本质是什么,以及 Spark 在性能调优部份的要点,这两点让在进入性能调优之前都是一个至关重要的问题,它的本质限制了我们调优到底要达到一个什么样的目标或者说我们是从什么本源上进行调优。希望这篇文章能为读者带出以下的启发: 了解大数据性能调优的本质 了解 Spark 性能调优要点分析 了解 Spark 在资源优化上的一些参数调优 了解 Spark 的一些比较高效的 RDD 操作算子
- 62KB
spark大数据案例
2018-11-12包含了Spark的一系列的小案例,包含core,sql,stream等案例
- 12.53MB
电商大数据 用数据驱动商和商业案例解析_试读版 PDF电子书下载 带书签目录.pdf
2018-01-25电商大数据 用数据驱动商和商业案例解析,介绍真实的电商案例供大家学习。
- 2.76MB
全量消费大数据商圈模型实战
2017-11-01Xmandata 全量消费大数据商圈模型实战,因果网络模型是一种计算元素之间因果关系的工 程类数学模型,相比于被广泛应用的统计性指标综 述,或被认为当前业界领先的传统统计类、经济类、 逻辑类模型的使用,无论精确度、人工工作量、模 型的落地效率都有了非常大的提升。
- 2.22MB
SparkSQL应用解析
2018-11-19sparkSQL详细解析:包括spark的基础RDD,以及sparkSQL的两大数据抽象 DataFrames与DataSet、sparkSQL数据源、输入输出、自定义函数、自定义分区等。
- 38.78MB
Spark大数据案例分析和介绍
2016-11-24hadoop spark parameter server 框架介绍,案例:计算广告、智慧城市、大数据背景下的金融产品定价
- 19.13MB
高分毕业设计 基于Hadoop+Kafka+Spark大数据平台的新闻日志分析处理及可视化系统源码+部署文档+全部数据资料.
2024-04-23【资源说明】 高分毕业设计 基于Hadoop+Kafka+Spark大数据平台的新闻日志分析处理及可视化系统源码+部署文档+全部数据资料. 【备注】 1、该项目是高分毕业设计项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过mac/window10/11/linux测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(如软件工程、计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
- 2.4MB
Scala-升级版.docx
2021-10-14Scala快速入门(适合为学Spark学习Scala的同学)Word文档
- 2.90MB
基于spark的图书推荐系统
2023-06-15推荐系统是一种信息过滤系统,能够自动预测用户对特定产品或服务的偏好,并向其提供个性化的推荐。它通常基于用户的历史行为、个人喜好、兴趣和偏好等,通过数据挖掘和机器学习算法,在大数据的支持下生成个性化的推荐内容,从而提高用户购买率和满意度。推荐系统广泛应用于电子商务、社交媒体、新闻资讯、音乐、电影等领域。推荐系统的作用是根据用户的历史行为和偏好,为用户推荐个性化的内容,以满足用户的需求和兴趣。 在推荐系统架构中,离线计算部分主要使用 Hadoop、Spark、Hive 等大数据处理技术,将海量历史数据进行离线处理,构建出推荐模型。在线计算部分则使用 Flask、Django 或 Tornado 等 Web 应用框架,将推荐模型部署到 Web 服务器上,实现实时推荐服务。
- 743KB
大数据期末课设~基于spark的气象数据处理与分析
2022-12-14大数据期末课设~基于spark的气象数据处理与分析 完整版Word 可以拿来直接交作业
- 550KB
全国职业技能大赛大数据赛项十套赛题(shtd)
2023-01-16使用Scala编写spark工程代码,将MySQL的shtd_store库中表user_info、sku_info、base_province、base_region、order_info、order_detail的数据增量抽取到Hive的ods库中对应表user_info、sku_info、base_province、base_region、order_info、order_detail中。 1、 抽取shtd_store库中user_info的增量数据进入Hive的ods库中表user_info。根据ods.user_info表中operate_time或create_time作为增量字段(即MySQL中每条数据取这两个时间中较大的那个时间作为增量字段去和ods里的这两个字段中较大的时间进行比较),只将新增的数据抽入,字段名称、类型不变,同时添加静态分区,分区字段类型为String,且值为当前比赛日的前一天日期(分区字段格式为yyyyMMdd)。使用hive cli执行show partitions ods.user_info命令,将结果截图粘贴至对应报告中;
- 69B
大数据全套教程完整版
2019-01-09大数据基础到精通完整版, 涵盖技术点:python 基础 java基础,mysql,oracle,ssm框架,linux,hadoop,hbase,zookeeper,flume,scala,spark。资源宝贵,速度下载
- 26.74MB
全国2014-2018年空气质量csv数据集文件数据
2019-06-23全国2014-2018年空气质量csv数据集文件数据,包含字段time(时间),city(城市),AQI,PM2.5,PM10,SO2,NO2,CO,O3,primary_pollutant(主要污染物),共计55万条数据。
- 0B
spark-3.3.1-bin-3.0.0-cdh6.3.2.tgz
2022-11-23spark 3.3.1 使用 cdh 6.3.2 的hadoop版本。可以直接兼容并配合文档进行cdh spark-sql的使用。 具体查看https://editor.csdn.net/md/?articleId=127997188
- 1.1MB
Spark气象监测数据分析:代码整合,包括预处理,分析,数据可视化
2023-09-17【内容概要】 通过完整的气象监测数据处理与分析项目,了解Spark大数据分析的整体流程。代码涵盖数据工程、统计分析、机器学习预测建模等内容。可以学习如何使用Spark PySpark API处理大规模数据。 【适合人群】 具备一定Python编程基础,需要处理分析大规模数据的研发人员。 【能学到什么】 1. Spark数据处理:缺失值处理、降噪、特征工程等数据预处理技术 2. 统计分析:分组聚合、相关性分析、异常检测等统计方法 3. 机器学习:时间序列预测模型设计、集成学习提升效果 4. 微服务:模型API和Docker部署,提供后端服务 【学习建议】 项目代码完整覆盖了大数据分析全流程。在学习过程中,需要结合代码注释和文档,了解设计思路和背后的原理。同时调试并运行示例代码,加深理解。欢迎提出改进意见。
- 9.26MB
基于hadoop和echarts的教育大数据可视化系统
2023-05-04在线教育平台现在是教育体系的重要组成部分,在当前大数据时代的背景下,促进教育机构建立统一平台、统一资源管理的数字化教学系统。如何评估系统平台的健康程度、学生的学习体验和在线课程的质量对于课程的教师和学校的管理人员都是非常重要的,这是进行数据分析的主要目的。可视化是一个重要的途径,它能够帮助大数据获得完整的数据图表并挖掘数据的价值,大数据分析离不开可视化这一工具的推动。 基于hadoop和echarts的教育大数据可视化系统,以B/S模式开发。通过Hadoop中Sqoop进行数据导入转换。以MapReduce构建数据分析,数据分析维度包括每日登录人数分析、平均学习时长分析、学习行为次数分析、每日活跃情况分析和分时段学习人数分析。最终使用ECharts可视化工具来对在线教育平台在学习过程中产生的数据进行可视化大屏展现,让更多人感受到可视化大数据的魅力。