Spark快速大数据分析
作者:(美)卡劳
出版社:北京图灵文化发展有限公司
ISBN:9787115403094
VIP会员免费
(仅需0.8元/天)
¥ 29.99
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
图灵程序设计丛书 Spark快速大数据分析 [(美)卡劳著][人民邮电出版社] 评分:
Spark开发者出品! 《Spark快速大数据分析》是一本为Spark初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark的用法,它对Spark的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。 本书介绍了开源集群计算系统Apache Spark,它可以加速数据分析的实现和运行。利用Spark,你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。 本书由Spark开发者编写,可以让数据科学家和工程师即刻上手。你能学到如何使用简短的代码实现复杂的并行作业,还能了解从简单的批处理作业到流处理以及机器学习等应用。
上传时间:2018-08 大小:68.41MB
- 13.90MB
[图灵程序设计丛书].Python数据科学手册_Python数据科学手册_
2021-10-03[图灵程序设计丛书].Python数据科学手册
- 7.18MB
JavaScript基础教程(第8版)图灵程序设计丛书.mobi
2018-03-21javascirpt基础教程(第8版)图灵程序设计丛书,适合在kindle上阅读,入门使用。
- 2.56MB
程序员的思维修炼 (图灵程序设计丛书)
2018-10-02程序员的思维修炼 (图灵程序设计丛书),特殊好的书,高级程序员推荐的书
- 2.80MB
学习正测表达式-图灵程序设计丛书系列.mobi
2018-10-31《学习正则表达式》从正则表达式的基本概念讲起,到编写完整的sed和Perl脚本,再到转换HTML文件,将这种强大的工具解释得清晰透彻。书中贯穿了大量简洁明了的示例,旨在让读者轻松掌握正则表达式。...
- 8.65MB
[图灵程序设计丛书].Spark高级数据分析.第2版1
2022-08-03前言xv第 1 章 大数据分析 11.1 数据科学面临的挑战 21.3 关于本书 51.4 第 2 版说明 6第 2 章 用 Scala 和 Spark 进行数
- 7.20MB
JavaScript基础教程(第8版)_图灵程序设计丛书 - Tom Negrino
2018-09-17JavaScript是一种可以用来给网页增加交互性的编程语言。但是,如果你不是程序员,那么也不必担心。Web上有大量JavaScript代码,复制一下并稍做修改,就可以供自己使用。实际上,这种“站在其他程序员肩膀上”的方式...
- 3.81MB
图灵程序设计丛书:嵌入式Linux基础教程(第2版)
2013-08-09ubuntu-linux必备,是初学者的好帮手,书中的内容通俗易通
- 120B
Bootstrap用户手册设计响应式网站+(图灵程序设计丛书+14).
2018-03-31Bootstrap用户手册设计响应式网站+(图灵程序设计丛书+14).
- 752KB
基于Python爬虫实现天气预报和数据可视化分析,应付数据分析大作业
2022-12-23基于Python爬虫实现天气预报和数据可视化分析,应付数据分析大作业,内含Python原文件及所需库说明
- 28.70MB
EDA探索式数据分析案例数据集
2024-02-25EDA探索式数据分析案例数据集
- 5.83MB
Python数据分析项目实践,包括数据读取、评估、清洗、分析、可视化机器学习相关内容等
2024-01-16Python数据分析项目实践,包括数据读取、评估、清洗、分析、可视化机器学习相关内容等
- 1.2MB
5-8抖音数据分析数据集
2023-05-08这个数据集对应我写的一篇博客,下载此数据集即可运行我的代码。
- 7.77MB
Python数据分析与可视化大作业 + 源代码 + 数据 + 详细文档
2024-04-11Python数据分析与可视化大作业 + 源代码 + 数据 + 详细文档
- 116KB
python数据分析大作业-爬虫、建立模型、可视化、结论分析
2023-06-09包括代码文件
- 0B
origin2021下载免费分享
2022-11-14origin2021 下载途径:百度网盘、阿里云盘下载
- 407.36MB
统计数模历年优秀论文-全国大学生统计建模大赛
2023-05-16为在大学生中倡导学习统计、应用统计的良好氛围,促进大学生关注经济社会热点难点问题,适应大数据时代下高校及统计部门对统计人才的培养要求,中国统计教育学会、全国应用统计专业学位研究生教育指导委员会联合举办2021年(第七届)全国大学生统计建模大赛,本届大赛主题为“数据新动能的统计测度研究”,旨在提高大学生数据挖掘、数据分析、运用统计方法及计算机技术处理数据的能力,加强创新思维意识,助力推进统计现代化改革。经过一年的筹备、征集和筛选评议工作,最终选出这26篇优秀论文集结成册,展示当代大学生的统计应用能力和研究水平。 欢迎扫描以上二维码订阅 扫一扫在手机打开 上一篇: 《2022年(第八届)... 下一篇: 关于公布2022年(第... 评论262 0/150 提交 热门评论 相关推荐 关于公布2023年(第九届)全国大学生统计建模大赛报名信息的通知 大赛动态 2023-04-10 10:00595451143 《2023年(第九届)全国大学生统计建模大赛主题解读》(视频) 大赛动态 2023-04-06 09:0046299990 “全国大学生统计建模大赛”成功入
- 1KB
r语言数据分析案例数据分析、数据预测和机器学习案例
2023-03-29如果您正在寻找一份完整的R语言数据分析、数据预测和机器学习案例,那么我们的资源库将为您提供一切所需。本资源库提供了一系列案例,包括数据可视化、数据清洗、机器学习模型构建和数据预测等内容。我们的案例旨在帮助您更好地了解R语言的使用和机器学习的基础知识。 我们的资源库包括以下主题: 数据可视化:使用ggplot2包和其他R语言可视化工具,展示如何将数据可视化,从而更好地理解数据并做出更明智的决策。 数据清洗:展示如何使用dplyr包和其他数据清洗工具来清洗和准备数据,使其可以用于机器学习模型的训练。 机器学习模型构建:使用caret包和其他机器学习工具,构建和训练各种类型的机器学习模型,包括回归、分类和聚类模型等。 数据预测:展示如何使用机器学习模型来预测未来数据,并对预测结果进行评估和优化。 每个案例都包含完整的代码和数据集,可以帮助您更好地了解每个步骤的细节和操作。我们的资源库适合各种级别的用户,包括初学者和有经验的用户。您可以根据自己的兴趣和需求选择不同的主题,并按照自己的步骤和想法来运行代码和修改案例。 如果正在寻找一份完整的R语言数据分析、数据预测和机器学习案例,
- 5.29MB
2023高教社数学建模C题 - 蔬菜类商品的自动定价与补货决策【数据处理详细代码】
2023-09-09商超(超市和零售店)在现代经济中扮演着至关重要的角色,然而,它们在蔬菜商品管理中面临着多重挑战。这些挑战包括如何准确预测销售趋势、合理制定价格策略、以及有效制定补货计划等问题。 解决这些问题对于商超来说至关重要,因为它们直接影响着销售收益、库存成本和客户满意度。因此,本研究旨在为商超提供一套全面的蔬菜商品管理策略,以帮助它们更好地应对这些挑战。 针对问题一,在蔬菜商品管理中,首要问题之一是如何准确预测销售趋势。这包括了不同蔬菜品类的销售模式,如季节性销售高峰和低谷。我们需要深入了解哪些蔬菜在特定时间段内销售最活跃,以及它们之间的差异。这个问题的解决有助于商超更有针对性地制定促销策略和补货计划。 针对问题二,制定合理的价格策略对于商超至关重要,因为它们需要平衡销售利润和客户价格敏感度。我们需要建立一个定价模型,考虑商品成本、预期销售量和销售利润等因素。这个模型将为每个蔬菜品类提供合理的售价建议,确保商超实现销售利润的最大化,同时提供具有竞争力的价格。 针对问题三,如何确定每个单品的补货量以及建议的定价策略是另一个重要问题。我们需要通过组合优化方法,确定每个单品的最佳补货量和定价策
- 18.32MB
摩拜共享单车数据分析项目数据、代码、图表
2020-09-30摩拜共享单车数据分析项目的数据、代码、图表,基于上海摩拜单车的2016年8月份随机抽样大约10万条的开放订单数据进行分析
- 197KB
大乐透第一期至今全部期数的开奖结果(2007年-2023年5月共2423期)
2023-05-26我们使用大数据进行数据分析的时候,数据为基础中的基础。很多彩民进行杀号分析的时候,需要花费不少时间进行数据统计。这个csv版本统计汇总了历年的开奖结果,一目了然。方便进行号码分析。
- 1.19MB
besnew-超强二进制文件查看工具
2022-03-21右键属性 支持16进制,10进制,二进制,8进制查看。 可自定义列数,独特码查找、不定帧长查看。方便数据帧分析。 免安装。 使用时可能需要先使用管理员权限启动。 注意事项: 1,一定要解压出来再用。 2,默认需要先打开bes,然后再从左上角打开要查看分析的文件。 最好设置一下管理员权限执行: 选中bes.exe文件,右键属性-》兼容性-》选中以管理员身份运行。 然后就可以找到数据文件,右键选择打开方式为bes.exe即可。
- 111.52MB
python数据分析课程设计
2021-03-17其中包含4个案例,以毕业论文的格式写出。包含原始数据。代码可复制粘贴。
- 1.49MB
基于Hadoop的电影影评数据分析
2023-04-04是大数据课程大作业,基于Hadoop的电影影评数据分析,需要安装Hadoop,了解MapReduce 和HDFS。
- 342KB
用于本项目的数据分析及可视化部分的源码
2022-05-25用于本项目的数据分析及可视化部分的源码
- 80KB
2023年数学建模C题思路分析
2023-09-10对于国赛问题二的问题分析
- 118.50MB
matlab2020a官方pdf文档
2020-09-29目前是matlab2020a的最新官方文档,其中涵盖了matlab入门基础、桌面工具和开发环境以及数据导入导出、matlab数学、数据分析、编程基础、面向对象编程、matlab图形、3d可视化等等。
- 3.36MB
R语言期末大作业(全面带报告,带数据集)
2022-05-24按照后期进行数据分析的需求,对数据进行预处理。 -描述性统计:选择合适的方法对数据进行统计分析。包括对数值型和类别型属性的统计,并对分析结果进行图形化的展示(使用ggplot2或者lattice包)。 -推断性统计:选择合适的假设检验方法,分析属性间的相关性、两组数据间是否具有显著性差异,分析结果并给出结论及必要的图形展示。 - 数据挖掘 根据数据特征及需求,利用分类、聚类或时间序列方法挖掘蕴含在数据中的模式及必要的图形展示,用回归模型预测走势 注意:对聚类结果分析聚簇特征 对分类结果计算准确性。 使用时间序列分析方法可判断数据是否存在趋势、周期性等特征,或对数据进行预测。 (分类、聚类、时间序列,回归模型至少使用2种方法)
- 1.61MB
2023高教社数学建模国赛C题 - 蔬菜类商品的自动定价与补货决策(完整参考论文)附word文档
2023-09-09要 商超(超市和零售店)在现代经济中扮演着至关重要的角色,然而,它们在蔬菜商品管理中面临着多重挑战。这些挑战包括如何准确预测销售趋势、合理制定价格策略、以及有效制定补货计划等问题。 解决这些问题对于商超来说至关重要,因为它们直接影响着销售收益、库存成本和客户满意度。因此,本研究旨在为商超提供一套全面的蔬菜商品管理策略,以帮助它们更好地应对这些挑战。 针对问题一,在蔬菜商品管理中,首要问题之一是如何准确预测销售趋势。这包括了不同蔬菜品类的销售模式,如季节性销售高峰和低谷。我们需要深入了解哪些蔬菜在特定时间段内销售最活跃,以及它们之间的差异。这个问题的解决有助于商超更有针对性地制定促销策略和补货计划。 针对问题二,制定合理的价格策略对于商超至关重要,因为它们需要平衡销售利润和客户价格敏感度。我们需要建立一个定价模型,考虑商品成本、预期销售量和销售利润等因素。这个模型将为每个蔬菜品类提供合理的售价建议,确保商超实现销售利润的最大化,同时提供具有竞争力的价格。 针对问题三,如何确定每个单品的补货量以及建议的定价策略是另一个重要问题。我们需要通过组合优化方法,确定每个单品的最佳补货量和
- 1.35MB
2022泰迪杯数据分析技能赛B题代码 Jupyter Notebook
2022-12-142022泰迪杯数据分析技能赛B题一等奖 方案及赛后总结:https://blog.csdn.net/u014111377/article/details/127905972 欢迎学习交流 任务1:数据探索与清洗 任务2:产品营销数据可视化分析 任务3:客户流失因素可视化分析 任务4:特征构建 任务5:银行客户长期忠诚度预测建模