Spark快速大数据分析
作者:(美)卡劳
出版社:北京图灵文化发展有限公司
ISBN:9787115403094
VIP会员免费
(仅需0.8元/天)
¥ 29.99
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
图灵程序设计丛书 Spark快速大数据分析 pdf 评分:
大数据是近几年广受关注的一个概念。今天,互联网不断发展,逐渐深入我们生活的各个层面,随之而来的是数据量的指数级增长。很久以前,人类就学会了通过分析数据获取有价值的结论。有时,影响结论的因素过多,采样的数据无法有效保留所有因素的影响,得出的结论就不够有效。如果不使用采样,而原始数据规模巨大,我们就需要改进数据处理的手段。从人工统计到利用一些传统的计算机软件进行分析,再到MapReduce 模型,随着数据规模不断增长,我们处理数据的方式也在不断升级。如今,硬件产业的不断发展使得内存计算成为了可能,Spark 由此出现,并且像它的名字一样,以星火之势,迅速赢得了工业界的青睐。 《Spark 快速大数据分析》是一本为Spark 初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark 的用法,它对Spark 的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。
上传时间:2017-12 大小:34.41MB
- 8.2MB
Spark-快速大数据分析-中文版书籍
2018-01-05Spark-快速大数据分析-中文版的书籍,翻译包含全部章节
- 328B
Spark大数据分析技术_网盘链接下载15.69M
2018-08-20Spark大数据分析技术,是一本为Spark初学者准备的书,没有过多深入实现细节,而更多关注上层用户的具体用法。尝试把spark应用到实践中,去探寻数据海洋里的无尽瑰宝。主要内容如下: 1)Spark数据分析导论 2)Spark下载与入门 3)RDD编程 4)键值对操作 5)数据读取与保存 6)Spark编程进阶 7)在集群上运行的Spark 8)Spark调优与调试 9)SparkSQL 10)Spark Streaming 11)基于MLlib的机器学习
- 13.90MB
[图灵程序设计丛书].Python数据科学手册_Python数据科学手册_
2021-10-03[图灵程序设计丛书].Python数据科学手册
- 7.18MB
JavaScript基础教程(第8版)图灵程序设计丛书.mobi
2018-03-21javascirpt基础教程(第8版)图灵程序设计丛书,适合在kindle上阅读,入门使用。
- 2.56MB
程序员的思维修炼 (图灵程序设计丛书)
2018-10-02程序员的思维修炼 (图灵程序设计丛书),特殊好的书,高级程序员推荐的书
- 2.80MB
学习正测表达式-图灵程序设计丛书系列.mobi
2018-10-31《学习正则表达式》从正则表达式的基本概念讲起,到编写完整的sed和Perl脚本,再到转换HTML文件,将这种强大的工具解释得清晰透彻。书中贯穿了大量简洁明了的示例,旨在让读者轻松掌握正则表达式。...
- 8.65MB
[图灵程序设计丛书].Spark高级数据分析.第2版1
2022-08-03前言xv第 1 章 大数据分析 11.1 数据科学面临的挑战 21.3 关于本书 51.4 第 2 版说明 6第 2 章 用 Scala 和 Spark 进行数
- 16.30MB
2019图灵书目.pdf
2019-06-172019图灵书目,前沿的技术书籍汇总,快速定位高质量的书籍
- 7.20MB
JavaScript基础教程(第8版)_图灵程序设计丛书 - Tom Negrino
2018-09-17JavaScript是一种可以用来给网页增加交互性的编程语言。但是,如果你不是程序员,那么也不必担心。Web上有大量JavaScript代码,复制一下并稍做修改,就可以供自己使用。实际上,这种“站在其他程序员肩膀上”的方式...
- 3.81MB
图灵程序设计丛书:嵌入式Linux基础教程(第2版)
2013-08-09ubuntu-linux必备,是初学者的好帮手,书中的内容通俗易通
- 114B
[图灵程序设计丛书].Android基础教程.第4版.pdf.txt
2019-06-15[图灵程序设计丛书].Android基础教程.第4版 百度云下载地址,电子版非扫描
- 120B
Bootstrap用户手册设计响应式网站+(图灵程序设计丛书+14).
2018-03-31Bootstrap用户手册设计响应式网站+(图灵程序设计丛书+14).
- 1.95MB
ChatGPT教程(终极版)最全整理
2023-05-16这是一篇动了某些人利益的良心教程。 这是一篇姗姗来迟的ChatGPT教程。 纯小白关于ChatGPT入门,你看我这篇文章就够了。 如果你已经用上了ChatGPT,更要恭喜你挖到宝藏,后面的高级技巧一定能让你有收获。 文章包含以下内容: 一、ChatGPT是啥?有什么用; 二、ChatGPT如何注册; 三、ChatGPT使用方法; 四、用ChatGPT搞钱; 五、高级技巧;
- 58KB
博客中Kmeans以及FCM算法数据(免积分)
2023-05-16博客中Kmeans以及FCM算法的数据,包括IRIS鸢尾花数据集、Wine葡萄酒数据集、Seed小麦种子数据集、glass数据集、WDBD乳腺癌数据集,下载在直接存入项目文件夹即可,如果下载不了,可以私信我,看到后会及时回复。
- 1.25MB
hugging face的models-openai-clip-vit-large-patch14文件夹
2023-10-25用于无法访问hugging face并需要运行stable-diffusion-webui时使用
- 10KB
神经网络回归预测--气温数据集
2021-11-26神经网络回归预测--气温数据集
- 1.87MB
XGBoost+LightGBM+LSTM-光伏发电量预测
2022-12-24包含比赛代码、数据、训练后的神经网络模型等。 在分析光伏发电原理的基础上,论证了辐照度、光伏板工作温度等影响光伏输出功率的因素,通过实时监测的光伏板运行状态参数和气象参数建立预测模型,预估光伏电站瞬时发电量,根据光伏电站DCS系统提供的实际发电量数据进行对比分析,验证模型的实际应用价值。 1 数据探索与数据预处理 1.1 赛题回顾 1.2 数据探索性分析与异常值处理 1.3 相关性分析 2 特征工程 2.1 光伏发电领域特征 2.2 高阶环境特征 3 模型构建与调试 3.1 预测模型整体结构 3.2 基于LightGBM与XGBoost的构建与调试 3.3 基于LSTM的模型构建与调试 3.4 模型融合与总结 4 总结与展望 参考文献
- 2.20MB
Mathwork+Matlab+编程手册
2023-08-25Introduction to Programming with MATLAB ~ Vanderbilt University
- 321KB
Stable-Diffusion WEBUI 简体中文语言包(2023.05.30更新)
2023-05-30AI绘图,Stable-Diffusion WEBUI,本地化(简体中文)语言文件。 原始文件来自翻译插件,根据自己实际使用情况,增加和修改了一些翻译。 配合【双语插件】看上去要自然一点,内容还在继续完善中。 本次增加了一些翻译内容,特别是插件。 同时继续合并了其它翻译插件的内容。 最近文字提示修改得有点多啊。 请放入“你的SDWebUI项目位置/localizations/”中。 中文翻译部分删掉了不少括起来的英文原文,所以别直接选它用。 请配合【Bilingual Localization】插件使用,双语同时显示,效果最好。
- 6.77MB
基于Python+pytorch的图像处理+附完整代码图像处理,能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作
2024-04-17Python+PyTorch:图像处理界的“瑞士军刀” 在图像处理这个充满魔法的世界里,Python和PyTorch这对黄金搭档,就像一位技艺高超的魔法师和一把无所不能的“瑞士军刀”,总能轻松解决各种看似棘手的难题。它们以高效、灵活和强大的特性,引领着图像处理技术的发展潮流,让无数开发者为之倾倒。Python,这位优雅的魔法师,以其简洁易懂的语法和丰富的库资源,赢得了广大开发者喜爱。无论是数据处理、机器学习还是深度学习,Python都能轻松应对,展现出其无与伦比的魅力。在图像处理领域,Python更是如鱼得水,通过OpenCV、PIL等库,能够轻松实现图像的读取、显示、裁剪、缩放、滤波等操作,让图像在指尖起舞。而PyTorch,这把图像处理界的“瑞士军刀”,则以其灵活性和易用性,成为深度学习领域的翘楚。它拥有强大的自动求导功能,能够轻松构建和训练复杂的神经网络模型。在图像处理中,PyTorch能够助力开发者构建出各种高效的图像识别、分割、生成等模型,让图像焕发出新的生机。想象一下,当你掌握了Python和PyTorch这对黄金搭档,就如同掌握了一把魔法杖和一把瑞士军刀。必然大可作为
- 407KB
时间序列预测模型实战案例(Xgboost)(Python)(机器学习)包括时间序列预测和时间序列分类,点击即可运行!
2023-09-25内容概要 资源包括三部分(时间序列预测部分和时间序列分类部分和所需的测试数据集全部包含在内) 在本次实战案例中,我们将使用Xgboost算法进行时间序列预测。Xgboost是一种强大的梯度提升树算法,适用于各种机器学习任务,它最初主要用于解决分类问题,在此基础上也可以应用于时间序列预测。 时间序列预测是通过分析过去的数据模式来预测未来的数值趋势。它在许多领域中都有广泛的应用,包括金融、天气预报、股票市场等。我们将使用Python编程语言来实现这个案例。 其中包括模型训练部分和保存部分,可以将模型保存到本地,一旦我们完成了模型的训练,我们可以使用它来进行预测。我们将选择合适的输入特征,并根据模型的预测结果来生成未来的数值序列。最后,我们会将预测结果与实际观测值进行对比,评估模型的准确性和性能。 适合人群:时间序列预测的学习者,机器学习的学习者, 能学到什么:本模型能够让你对机器学习和时间序列预测有一个清楚的了解,其中还包括数据分析部分和特征工程的代码操作 阅读建议:大家可以仔细阅读代码部分,其中包括每一步的注释帮助读者进行理解,其中涉及到的知识有数据分析部分和特征工程的代码操作。
- 40.89MB
中文短信数据集-带标签
2024-02-05本数据集可用于进行文本分类、信息检索等自然语言处理实验,共包含80万条短信。其中:原始数据集data.txt每行为1条短信,格式为“标签\t短信内容”,标签=0表示正常短信,标签=1表示垃圾短信。train.csv和test.csv为拆分后的训练集与测试集,拆分代码为train_test_split.py。stopwords.txt为使用的停用词。 基于该数据集的文本分类详见文章https://blog.csdn.net/baidu_40395808/article/details/135793836,基于该数据集的信息检索详见文章https://blog.csdn.net/baidu_40395808/article/details/135897480。 示例如下: 0 商业秘密的秘密性那是维系其商业价值和垄断地位的前提条件之一 1 《依林美容》三.八.女人节倾情大放送活动开始啦!!!!超值套餐等你拿,活动时间x月x日一x月xx日, 详情进店咨询。美丽热线x
- 1.3MB
亚博K210模型训练部署
2023-07-11亚博K210模型训练部署
- 174.14MB
Plecs电力电子仿真PLECS41.64 电力系统仿真软件免安装版本
2023-02-02超级容易学习的电力电子仿真软件。 PLECS是一个用于电路和控制结合的多功能仿真软件,尤其适用于电力电子和传动系统。 对于仿真Buck电路,Boost电路,单相整流电路,单相逆变电路,三相整流电路,三相逆变电路,LLC电路等都能够完美实现。并且能够直接使用C语言进行编程仿真,让代码直接写完以后完整运行到控制板中。 Plecs主要解决了Matlab Simulink仿真速度很慢,学习过程复杂和困难等问题。 Plexim在电力电子仿真领域处于世界领先地位。首要软件产品PLECS可以协助用户加快产品开发和创新流程。其优势来源于先进的编程技术,以及融合了非常规建模概念的仿真算法。通过认真听取工程师的需求和建议,我们能够为客户的今天和未来提供满意的解决方案。 从2002年开始,PLECS已经在众多工业领域成为电力电子仿真的标准。典型应用涵盖新能源,车辆电子,航空航天,工业及牵引驱动等。
- 1.29MB
基于鲸鱼优化算法优化VMD参数试看效果代码(目标函数为样本熵)
2022-10-301.采用鲸鱼算法优化VMD分解层数和惩罚系数的MATLAB代码,目标函数根据样本熵计算。直接运行,可以换数据。 2.核心算法加密,有需要请在CSDN联系作者。
- 20KB
机器学习期末复习题及答案
2023-03-19机器学习期末复习题及答案
- 751.19MB
TransUnet复现,完整代码(附实现说明)
2024-04-25TransUnet复习,完整代码(附实现说明)
- 114.86MB
XiaoWei Setup 0.3.7-rdm.2.exe
2024-04-24XiaoWei Setup 0.3.7-rdm.2.exe
- 18.16MB
基于CNN卷积神经网络花朵花卉识别系统GUI界面.zip代码119
2024-04-19基于CNN卷积神经网络花朵花卉识别系统,有数据集进行训练,可以增加其它花朵图像数据。 基于CNN卷积神经网络花朵花卉识别系统,有数据集进行训练,可以增加其它花朵图像数据。 基于CNN卷积神经网络花朵花卉识别系统,有数据集进行训练,可以增加其它花朵图像数据。
- 1.7MB
yolov8调用zed相机实现三维测距(版本一)
2024-04-16yolov8调用zed相机实现三维测距(版本一),具体内容见博客https://blog.csdn.net/qq_45077760?type=blog