Spark SQL入门与实践指南
作者:纪涵、靖晓文、赵政达
出版社:清华大学出版社
ISBN:9787302496700
VIP会员免费
(仅需0.8元/天)
¥ 29.4
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
Spark内核设计的艺术架构设计与实现.7z 评分:
多位专家联袂推荐,360大数据专家撰写,基于Spark 2.1.0剖析架构与实现精髓。细化到方法级,提炼出多个流程图,立体呈现架构、环境、调度、存储、计算、部署、API七大核心设计。本书一共有10章内容,主要包括以下部分。 准备部分(第1~2章):简单介绍了Spark的环境搭建和基本原理。本部分通过详尽的描述,有效降低了读者进入Spark世界的门槛,同时能对Spark背景知识及整体设计有宏观的认识。
上传时间:2019-05 大小:145.95MB
- 22.75MB
Spark技术内幕 深入解析Spark内核架构设计与实现原理.pdf
2018-02-24Spark技术内幕 深入解析Spark内核架构设计与实现原理.pdfSpark技术内幕 深入解析Spark内核架构设计与实现原理.pdf
- 6.20MB
Spark技术内幕深入解析Spark内核架构设计与实现原理.pdf
2017-05-14Spark技术内幕深入解析Spark内核架构设计与实现原理.pdf
- 22.66MB
Spark技术内幕深入解析Spark内核架构设计与实现原理
2017-12-04Spark技术内幕深入解析Spark内核架构设计与实现原理 Spark技术内幕深入解析Spark内核架构设计与实现原理
- 157.62MB
spark内核设计与艺术.zip
2019-06-28spark内核设计与艺术PDF完整版,无广告版,乐于学习源码的同学赶快下载吧
- 289B
Spark技术内幕 深入解析Spark内核架构设计与实现原理 百度云pdf 张安站
2017-11-19Spark技术内幕 深入解析Spark内核架构设计与实现原理 百度云pdf 百度云链接下载 张安站著作
- 21.60MB
Spark技术内幕-深入解析Spark内核架构设计与实现原理(带书签目录)
2019-02-24spark是一种快速、通用、可扩展的大数据分析引擎。Spark 核心的概念是 Resilient Distributed Dataset (RDD):一个可并行操作的有容错机制的数据集合。有 2 种方式创建 RDDs:第一种是在你的驱动程序中并行化一个...
- 157.66MB
spark 内核艺术.zip
2019-05-10spark 内核设计艺术超长文本,解析spark 技术原理额细节,相当详细。
- 30.61MB
Spark技术内幕 深入解析Spark内核架构设计与实现原理
2018-04-11Spark技术内幕 深入解析Spark内核架构设计与实现原理
- 21.60MB
Spark技术内幕-深入解析Spark内核架构设计与实现原理(高清书签版)
2018-03-23《Spark技术内幕:深入解析Spark内核架构设计与实现原理》以源码为基础,深入分析Spark内核的设计理念和架构实现,系统讲解各个核心模块的实现,为性能调优、二次开发和系统运维提供理论支持;本文最后以项目实战的...
- 21.0MB
Spark技术内幕:深入解析Spark内核架构设计与实现原理
2018-01-29Spark技术内幕:深入解析Spark内核架构设计与实现原理,高清影音,pdf
- 30.49MB
Spark技术内幕 深入解析Spark内核架构设计
2018-04-14多位Spark的贡献者和专家联袂推荐,详细剖析spark内核各个模块并辅以相应源码解析的著作。全面分析spark内核各个模块的设计思想和实现原理,深入理解其内部运作机制和实现细节。
- 51.99MB
ApacheSpark设计与实现.pdf+ApacheSpark源码剖析.pdf+Spark原著中文版.pdf
2017-11-22ApacheSpark设计与实现.pdf+ApacheSpark源码剖析.pdf+Spark原著中文版.pdf
- 22.75MB
Spark技术内幕 深入解析Spark内核架构设计与实现原理 高清 完整书签
2018-03-11Spark技术内幕 深入解析Spark内核架构设计与实现原理 高清 完整书签
- 787KB
基于Spark的电影推荐系统的设计与实现.docx
2022-05-30基于Spark的电影推荐系统的设计与实现.docx基于Spark的电影推荐系统的设计与实现.docx基于Spark的电影推荐系统的设计与实现.docx基于Spark的电影推荐系统的设计与实现.docx基于Spark的电影推荐系统的设计与实现.docx...
- 197KB
基于spark框架的图书馆微信服务平台设计与实现.pdf
2022-07-07基于spark框架的图书馆微信服务平台设计与实现.pdf基于spark框架的图书馆微信服务平台设计与实现.pdf基于spark框架的图书馆微信服务平台设计与实现.pdf基于spark框架的图书馆微信服务平台设计与实现.pdf基于spark...
- 2.4MB
Scala-升级版.docx
2021-10-14Scala快速入门(适合为学Spark学习Scala的同学)Word文档
- 2.90MB
基于spark的图书推荐系统
2023-06-15推荐系统是一种信息过滤系统,能够自动预测用户对特定产品或服务的偏好,并向其提供个性化的推荐。它通常基于用户的历史行为、个人喜好、兴趣和偏好等,通过数据挖掘和机器学习算法,在大数据的支持下生成个性化的推荐内容,从而提高用户购买率和满意度。推荐系统广泛应用于电子商务、社交媒体、新闻资讯、音乐、电影等领域。推荐系统的作用是根据用户的历史行为和偏好,为用户推荐个性化的内容,以满足用户的需求和兴趣。 在推荐系统架构中,离线计算部分主要使用 Hadoop、Spark、Hive 等大数据处理技术,将海量历史数据进行离线处理,构建出推荐模型。在线计算部分则使用 Flask、Django 或 Tornado 等 Web 应用框架,将推荐模型部署到 Web 服务器上,实现实时推荐服务。
- 743KB
大数据期末课设~基于spark的气象数据处理与分析
2022-12-14大数据期末课设~基于spark的气象数据处理与分析 完整版Word 可以拿来直接交作业
- 550KB
全国职业技能大赛大数据赛项十套赛题(shtd)
2023-01-16使用Scala编写spark工程代码,将MySQL的shtd_store库中表user_info、sku_info、base_province、base_region、order_info、order_detail的数据增量抽取到Hive的ods库中对应表user_info、sku_info、base_province、base_region、order_info、order_detail中。 1、 抽取shtd_store库中user_info的增量数据进入Hive的ods库中表user_info。根据ods.user_info表中operate_time或create_time作为增量字段(即MySQL中每条数据取这两个时间中较大的那个时间作为增量字段去和ods里的这两个字段中较大的时间进行比较),只将新增的数据抽入,字段名称、类型不变,同时添加静态分区,分区字段类型为String,且值为当前比赛日的前一天日期(分区字段格式为yyyyMMdd)。使用hive cli执行show partitions ods.user_info命令,将结果截图粘贴至对应报告中;
- 26.74MB
全国2014-2018年空气质量csv数据集文件数据
2019-06-23全国2014-2018年空气质量csv数据集文件数据,包含字段time(时间),city(城市),AQI,PM2.5,PM10,SO2,NO2,CO,O3,primary_pollutant(主要污染物),共计55万条数据。
- 69B
大数据全套教程完整版
2019-01-09大数据基础到精通完整版, 涵盖技术点:python 基础 java基础,mysql,oracle,ssm框架,linux,hadoop,hbase,zookeeper,flume,scala,spark。资源宝贵,速度下载
- 0B
spark-3.3.1-bin-3.0.0-cdh6.3.2.tgz
2022-11-23spark 3.3.1 使用 cdh 6.3.2 的hadoop版本。可以直接兼容并配合文档进行cdh spark-sql的使用。 具体查看https://editor.csdn.net/md/?articleId=127997188
- 9.26MB
基于hadoop和echarts的教育大数据可视化系统
2023-05-04在线教育平台现在是教育体系的重要组成部分,在当前大数据时代的背景下,促进教育机构建立统一平台、统一资源管理的数字化教学系统。如何评估系统平台的健康程度、学生的学习体验和在线课程的质量对于课程的教师和学校的管理人员都是非常重要的,这是进行数据分析的主要目的。可视化是一个重要的途径,它能够帮助大数据获得完整的数据图表并挖掘数据的价值,大数据分析离不开可视化这一工具的推动。 基于hadoop和echarts的教育大数据可视化系统,以B/S模式开发。通过Hadoop中Sqoop进行数据导入转换。以MapReduce构建数据分析,数据分析维度包括每日登录人数分析、平均学习时长分析、学习行为次数分析、每日活跃情况分析和分时段学习人数分析。最终使用ECharts可视化工具来对在线教育平台在学习过程中产生的数据进行可视化大屏展现,让更多人感受到可视化大数据的魅力。
- 1.1MB
Spark气象监测数据分析:代码整合,包括预处理,分析,数据可视化
2023-09-17【内容概要】 通过完整的气象监测数据处理与分析项目,了解Spark大数据分析的整体流程。代码涵盖数据工程、统计分析、机器学习预测建模等内容。可以学习如何使用Spark PySpark API处理大规模数据。 【适合人群】 具备一定Python编程基础,需要处理分析大规模数据的研发人员。 【能学到什么】 1. Spark数据处理:缺失值处理、降噪、特征工程等数据预处理技术 2. 统计分析:分组聚合、相关性分析、异常检测等统计方法 3. 机器学习:时间序列预测模型设计、集成学习提升效果 4. 微服务:模型API和Docker部署,提供后端服务 【学习建议】 项目代码完整覆盖了大数据分析全流程。在学习过程中,需要结合代码注释和文档,了解设计思路和背后的原理。同时调试并运行示例代码,加深理解。欢迎提出改进意见。
- 2.44MB
数据分析-基于Spark实现对全国历史气象数据进行分析.zip
2024-05-05数据分析_基于Spark实现对全国历史气象数据进行分析
- 1.71MB
python爬虫爬取股票评论,调用百度AI进行语义分析, matlab数据处理,股票涨跌和评论的关系
2019-03-22python爬虫爬取股票评论, 调用百度AI进行语义分析, matlab数据处理, excel作图 股票涨跌和评论的关系
- 9.96MB
大数据面试大总结300页.zip
2021-07-18大数据面试大总结300页.zip
- 221.10MB
spark-3.1.3-bin-hadoop3.2.tgz
2022-05-19Apache Spark版本3.1.3。Linux安装包。spark-3.1.3-bin-hadoop3.2.tgz
- 36.99MB
sbt-1.9.0.tgz
2023-08-07sbt-1.9.0.tgz