Spark全栈数据分析
作者:(美)罗素·朱尼
出版社:电子工业出版社
ISBN:9787121351662
VIP会员免费
(仅需0.8元/天)
¥ 39.6
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
Spark高级数据分析高清 PDF+源代码 评分:
本书是使用 Spark 进行大规模数据分析的实战宝典,由著名大数据公司 Cloudera 的数据科学 家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了 Spark,然后介绍了用 Spark 和 Scala 进行数据处理的基础知识,接着讨论了如何将 Spark 用于机器学习,同时介绍了常见应 用中几个最常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询 Wikipedia 或分析基因数据。 本书适合从事大数据分析的各类专业人员阅读。
上传时间:2018-04 大小:10.35MB
- 41.1MB
Spark源码分析.pdf
2019-04-16学习Spark源码的书,研究Hadoop、Spark等大数据技术的可以看看
- 375KB
spark源码分析.pdf
2018-09-01spark源码分析,RDD、Iterator、Job、DAG、Stage、Taskset、task等
- 38.72MB
深入理解Spark:核心思想及源码分析.pdf
2018-04-12深入理解Spark:核心思想及源码分析.pdf 深入理解Spark:核心思想及源码分析.pdf
- 58.52MB
深入理解Spark 核心思想与源码分析.pdf
2018-03-01讲解SparkContext的初始化、存储体系、任务提交与执行、计算引擎及部署模式的原理和源码分析
- 7.16MB
spark 高级数据分析
2018-06-11对Spark 这个技术,国内研究比较多的是原理和源代码,而许多客户抱怨Spark 应用 落地难。造成这一现象的一个主要原因是Spark 技术比较新,许多应用还处在探索阶段。 Cloudera 公司作为全球大数据领域的领头羊,在给...
- 35.86MB
基于Spark+python大数据分析课程作业+源代码+文档说明
2023-12-17数据预处理 进行关键词提取之前,需要对源文件进行一系列预处理: 提取PDF为TXT文件 分句 分词(词干提取、词形还原) 过滤数字、特殊字符等,大小写转换 - 小白不懂运行,下载完可以私聊问,可远程教学 该资源内...
- 167KB
基于大数据平台数据分析技术选型调研.pdf
2022-12-24基于⼤数据平台数据分析技术选型调研 技术选型调研 ⼤⽅向任务 分布式平台 选出⼏个可⾏的⽅案 分析优缺点 任务细分: 数据源存储的问题 ⽀持分布式的深度学习组件 业内端到端的解决⽅案有哪些——可借鉴的架构⽅案 ...
- 38KB
高级java笔试题-EBook-PDF:ITPDF电子书
2021-06-02高级java笔试题 EBook-PDF 我的个人订阅号,会定期分享我的读书笔记, 期待你的关注,我们一起学习交流,共同进步 IT PDF电子书 网络应用框架 Netty权威指南第2版.pdf ...Hadoop大数据分析与挖掘实战.pdf
- 73KB
大数据项目实训总结-大数据分析处理实践的一点心得.pdf
2022-12-24⼤数据项⽬实训总结_⼤数据分析处理实践的⼀点⼼得 最近的项⽬中,需要对海量的原始数据进⾏加⼯处理。并且数据的来源也不尽相同,数据处理链条很长。针对这种实际应⽤中的场景,有⼏ 点⼩⼩的新的体会,特意总结⼀...
- 108KB
大数据项目实训总结-大数据实习报告.doc.pdf
2022-12-24四、数据流图及程序结 构框图五、程序源代码及其说明菜单界⾯代码:Private Sub m_about_Click() frmAbout.Show End SubPrivate Sub m_book_Click() frmBookManage.Show End SubPrivate Sub m_bookquery_Click() ...
- 14.58MB
Data Analysis with Python and PySpark.pdf
2022-03-21使用Python和PySpark进行数据分析可以帮助您解决使用PySpark进行数据科学的日常挑战。您将了解如何在从任何源(Hadoop集群、云数据存储或本地数据文件)获取数据的同时,在多台机器上扩展处理能力。一旦您了解了这些...
- 195KB
大数据平台架构.pdf
2022-12-24⼤数据平台架构 前⾯提到各种⼤数据技术的原理与架构,⼤数据计算通过将可执⾏的代码分发到⼤规模的服务器集群上进⾏分布式计算,以处理⼤规模的数 据,即所谓的移动计算⽐移动数据更划算。但是这样的计算⽅式必然...
- 686KB
WeDataSphere:WeDataSphere是用于大数据平台的财务级别的一站式开源手提箱。 目前,Scriptis和Linkis的源代码已经发布到开源社区。 WeDataSphere,轻松实现大数据!-one source code
2021-03-24用于交互式数据分析,包括脚本开发(SQL,Pyspark,HiveQL),任务提交(Spark,Hive),UDF,功能,资源管理和智能诊断。 到Github仓库 是一站式的数据质量管理平台,支持对各种数据源进行质量验证,
- 3.52MB
Hadoop基础培训教程.pdf
2022-12-25Transform to the power of data 大数据基础培训教程 ...Hadoop 社区以投票的形式决 定Hadoop版本的发 展方向 100%开放源代码,兼 容社区版,Hadoop市 场占有率全球第一, 社区的主导力量 100%开放源代码,完 全兼
- 938KB
大数据的基础知识.pdf
2022-12-24⼤数据的基础知识 1、⼤数据的基础知识 ⼤数据的概念 ⼤数据(big data),IT⾏业术语,是指⽆法在⼀定时间范围内⽤常规软件⼯具进⾏捕捉、管理和处理的数据集合,是...R是属于GNU系统的⼀个⾃由、免费、源代码开放的
- 1.26MB
FusionInsightHD华为大数据平台.pdf
2022-12-24(Django Python 是开放源代码的Web应⽤框架。)Hue由"Supervisor Process"和"WebServer"构成。"Supervisor Process"是Hue的核⼼ 进程,负责应⽤进程管理。"Supervisor Process"和"WebServer"通过"THRIFT/REST"接⼝...
- 84.71MB
Cloudera-Data-Scientist-Challenge-3:我的 Cloudera Data Science Challenge 3 解决方案。Smartfly 的 Spark MLlib。 用于 Winklr 的 Spark GraphX。 用于网络日志分析的 Python Streaming
2021-06-29这是 Doug Needham 的提交包 数据科学挑战 3 此解决方案的正确编写在此目录... 至于源数据。 下面的所有代码都假设挑战的数据位于以下位置和结构中: /user/dsc/着名的/spam.log /user/dsc/着名的/web.log /user/d
- 752KB
基于Python爬虫实现天气预报和数据可视化分析,应付数据分析大作业
2022-12-23基于Python爬虫实现天气预报和数据可视化分析,应付数据分析大作业,内含Python原文件及所需库说明
- 28.70MB
EDA探索式数据分析案例数据集
2024-02-25EDA探索式数据分析案例数据集
- 5.83MB
Python数据分析项目实践,包括数据读取、评估、清洗、分析、可视化机器学习相关内容等
2024-01-16Python数据分析项目实践,包括数据读取、评估、清洗、分析、可视化机器学习相关内容等
- 1.2MB
5-8抖音数据分析数据集
2023-05-08这个数据集对应我写的一篇博客,下载此数据集即可运行我的代码。
- 7.77MB
Python数据分析与可视化大作业 + 源代码 + 数据 + 详细文档
2024-04-11Python数据分析与可视化大作业 + 源代码 + 数据 + 详细文档
- 116KB
python数据分析大作业-爬虫、建立模型、可视化、结论分析
2023-06-09包括代码文件
- 1KB
r语言数据分析案例数据分析、数据预测和机器学习案例
2023-03-29如果您正在寻找一份完整的R语言数据分析、数据预测和机器学习案例,那么我们的资源库将为您提供一切所需。本资源库提供了一系列案例,包括数据可视化、数据清洗、机器学习模型构建和数据预测等内容。我们的案例旨在帮助您更好地了解R语言的使用和机器学习的基础知识。 我们的资源库包括以下主题: 数据可视化:使用ggplot2包和其他R语言可视化工具,展示如何将数据可视化,从而更好地理解数据并做出更明智的决策。 数据清洗:展示如何使用dplyr包和其他数据清洗工具来清洗和准备数据,使其可以用于机器学习模型的训练。 机器学习模型构建:使用caret包和其他机器学习工具,构建和训练各种类型的机器学习模型,包括回归、分类和聚类模型等。 数据预测:展示如何使用机器学习模型来预测未来数据,并对预测结果进行评估和优化。 每个案例都包含完整的代码和数据集,可以帮助您更好地了解每个步骤的细节和操作。我们的资源库适合各种级别的用户,包括初学者和有经验的用户。您可以根据自己的兴趣和需求选择不同的主题,并按照自己的步骤和想法来运行代码和修改案例。 如果正在寻找一份完整的R语言数据分析、数据预测和机器学习案例,
- 407.36MB
统计数模历年优秀论文-全国大学生统计建模大赛
2023-05-16为在大学生中倡导学习统计、应用统计的良好氛围,促进大学生关注经济社会热点难点问题,适应大数据时代下高校及统计部门对统计人才的培养要求,中国统计教育学会、全国应用统计专业学位研究生教育指导委员会联合举办2021年(第七届)全国大学生统计建模大赛,本届大赛主题为“数据新动能的统计测度研究”,旨在提高大学生数据挖掘、数据分析、运用统计方法及计算机技术处理数据的能力,加强创新思维意识,助力推进统计现代化改革。经过一年的筹备、征集和筛选评议工作,最终选出这26篇优秀论文集结成册,展示当代大学生的统计应用能力和研究水平。 欢迎扫描以上二维码订阅 扫一扫在手机打开 上一篇: 《2022年(第八届)... 下一篇: 关于公布2022年(第... 评论262 0/150 提交 热门评论 相关推荐 关于公布2023年(第九届)全国大学生统计建模大赛报名信息的通知 大赛动态 2023-04-10 10:00595451143 《2023年(第九届)全国大学生统计建模大赛主题解读》(视频) 大赛动态 2023-04-06 09:0046299990 “全国大学生统计建模大赛”成功入
- 0B
origin2021下载免费分享
2022-11-14origin2021 下载途径:百度网盘、阿里云盘下载
- 5.29MB
2023高教社数学建模C题 - 蔬菜类商品的自动定价与补货决策【数据处理详细代码】
2023-09-09商超(超市和零售店)在现代经济中扮演着至关重要的角色,然而,它们在蔬菜商品管理中面临着多重挑战。这些挑战包括如何准确预测销售趋势、合理制定价格策略、以及有效制定补货计划等问题。 解决这些问题对于商超来说至关重要,因为它们直接影响着销售收益、库存成本和客户满意度。因此,本研究旨在为商超提供一套全面的蔬菜商品管理策略,以帮助它们更好地应对这些挑战。 针对问题一,在蔬菜商品管理中,首要问题之一是如何准确预测销售趋势。这包括了不同蔬菜品类的销售模式,如季节性销售高峰和低谷。我们需要深入了解哪些蔬菜在特定时间段内销售最活跃,以及它们之间的差异。这个问题的解决有助于商超更有针对性地制定促销策略和补货计划。 针对问题二,制定合理的价格策略对于商超至关重要,因为它们需要平衡销售利润和客户价格敏感度。我们需要建立一个定价模型,考虑商品成本、预期销售量和销售利润等因素。这个模型将为每个蔬菜品类提供合理的售价建议,确保商超实现销售利润的最大化,同时提供具有竞争力的价格。 针对问题三,如何确定每个单品的补货量以及建议的定价策略是另一个重要问题。我们需要通过组合优化方法,确定每个单品的最佳补货量和定价策
- 18.32MB
摩拜共享单车数据分析项目数据、代码、图表
2020-09-30摩拜共享单车数据分析项目的数据、代码、图表,基于上海摩拜单车的2016年8月份随机抽样大约10万条的开放订单数据进行分析
- 1.46MB
基于python的新冠疫情数据分析.zip
2020-06-27利用了requests包爬取腾讯实时疫情数据,并对疫情数据做了清洗和分析,对数据分析的结果实现了可视化。压缩包内有源代码和报告。