Spark机器学习:核心技术与实践
作者:Alex Tellez,Michal Malohlava
出版社:机械工业出版社
ISBN:9787111598466
VIP会员免费
(仅需0.8元/天)
¥ 30.0
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
Spark机器学习第1课.Spark介绍 评分:
课程目录: 课时1:Spark介绍 课时2:Spark2集群安装 课时3:Spark RDD操作 课时4:SparkRDD原理剖析 课时5:Spark2sql从mysql中导入 课时6:Spark1.6.2sql与mysql数据交互 课时7:SparkSQL java操作mysql数据 课时8:Spark统计用户的收藏转换率 课时9:Spark梳理用户的收藏以及订单转换率 课时10:最终获取用户的收藏以及订单转换率 课时11:Spark Pipeline构建随机森林回归预测模型 课时12:Spark 随机森林回归预测结果并存储进mysql 课时13:Spark对收藏转预测换率与真正的转换率对比,以及决策树模型构建 课时14:Spark机器学习对各种监督与非监督分类学习详细介绍 课时15:Spark协同过滤算法,构建用户与产品模型 课时16:Spark协同算法完成给用户推荐产品 课时17:mongodb的安装以及其基本操作 课时18:Spark与mongodb整合 课时19:Spark预测收藏以及给用户推荐的产品存储进mongodb 课时20:操作RDD需要注意点,以及Spark内存分配资源调优 课时21:Spark整个学习过程及其总结
上传时间:2016-09 大小:23.69MB
- 10.98MB
Spark机器学习1
2022-08-04内 容 提 要本书每章都设计了案例研究,以机器学习算法为主线,结合实例探讨了 Spark 的实际应用。书中没有让人抓狂的数据公式,而是从准备和正确认识数据开始讲
- 24.4MB
Spark机器学习实战介绍
2023-04-25Spark机器学习实战介绍
- 300KB
用Spark进行大数据处理之机器学习篇
2021-01-27在本篇文章,作者将讨论机器学习概念以及如何使用SparkMLlib来进行预测分析。后面将会使用一个例子展示SparkMLlib在机器学习领域的强悍。Spark机器学习API包含两个package:spark.mllib和spark.ml。spark.mllib包含基于弹性数据集(RDD)的原始Spark机器学习API。它提供的机器学习技术有:相关性、分类和回归、协同过滤、聚类和数据降维。spark.ml提供建立在DataFrame的机器学习API,DataFrame是SparkSQL的核心部分。这个包提供开发和管理机器学习管道的功能,可以用来进行特征提取、转换、选择器和机器学习算
- 837KB
Spark MLlib机器学习第1周
2019-08-10Spark MLlib机器学习 黄美灵,网名:sunbow,Spark爱好者,现从事移动互联网的计算广告和数据变现工作。 《Spark MLlib机器学习:算法、源码及实战详解》作者
- 10.18MB
IT十八掌_Spark阶段学习笔记(Spark+Mahout+机器学习)
2017-09-03IT十八掌第三期大数据配套学习笔记! 1.Spark简介 2.Spark部署和运行 3.Spark程序开发 4. Spark编程模型 5.作业执行解析 6.Spark SQL与DataFrame ...8.Spark MLlib与机器学习 9.GraphX与SparkR 10.mahout
- 8.41MB
基于Spark机器学习的电商推荐系统设计与实现.zip
2023-07-11有任何问题也可以随时私信博主,博主会第一时间给您解答!!! 本资源中的源码都是经过本地编译过可运行的,下载后按照文档配置好环境就可以运行。资源项目的难度比较适中,内容都是经过助教老师审定过的,应该能够...
- 2.95MB
Spark实战高手之路 - Spark亚太研究院.part4.rar
2015-08-17【Spark亚太研究院系列丛书】《Spark机器学习库(v1.2.0)》-王宇舟 【Spark亚太研究院系列丛书】Spark实战高手之路-第1章(1) 【Spark亚太研究院系列丛书】Spark实战高手之路-第1章(2) 【Spark亚太研究院系列丛书...
- 50.0MB
Spark实战高手之路 - Spark亚太研究院.part3.rar
2015-08-17【Spark亚太研究院系列丛书】《Spark机器学习库(v1.2.0)》-王宇舟 【Spark亚太研究院系列丛书】Spark实战高手之路-第1章(1) 【Spark亚太研究院系列丛书】Spark实战高手之路-第1章(2) 【Spark亚太研究院系列丛书...
- 654KB
SparkonAngel:Spark机器学习的核心加速器
2021-02-25Spark的核心概念是RDD,而RDD的关键特性之一是其不可变性,来规避分布式环境下复杂的各种并行问题。这个抽象,在数据分析的领域是没有问题的,它能最大化的解决分布式问题,简化各种算子的复杂度,并提供高性能的分布式数据处理运算能力。然而在机器学习领域,RDD的弱点很快也暴露了。机器学习的核心是迭代和参数更新。RDD凭借着逻辑上不落地的内存计算特性,可以很好的解决迭代的问题,然而RDD的不可变性,却非常不适合参数反复多次更新的需求。这本质上的不匹配性,导致了Spark的MLlib库,发展一直非常缓慢,从2015年开始就没有实质性的创新,性能也不好。为此,Angel在设计生态圈的时候,优先考虑了S
- 4.77MB
Spark 机器学习.xmind.zip
2020-09-13MLlib是Spark的机器学习(ML)库。其目标是使实用的机器学习可扩展且容易,思维导图中详细地描述了Spark ML机器学习库相关的技术点及使用示例
- 35.8MB
Spark机器学习案例实战.pdf
2021-07-25大数据培训期间,课堂教材
- 50.0MB
Spark实战高手之路 - Spark亚太研究院.part2.rar
2015-08-17【Spark亚太研究院系列丛书】《Spark机器学习库(v1.2.0)》-王宇舟 【Spark亚太研究院系列丛书】Spark实战高手之路-第1章(1) 【Spark亚太研究院系列丛书】Spark实战高手之路-第1章(2) 【Spark亚太研究院系列丛书...
- 1.96MB
用于SparkStreaming的数据挖掘streamDM.zip
2019-07-19streamDM,是由华为诺亚方舟实验...包含以下方法:在第一次开放的 StreamDM 中,我们部署了:SGD Learner and PerceptronNaive BayesCluStreamHoeffding Decision TreesBaggingStream KM 我们部署了以下数据生成器:...
- 50.0MB
Spark实战高手之路 - Spark亚太研究院.part1.rar
2015-08-17【Spark亚太研究院系列丛书】《Spark机器学习库(v1.2.0)》-王宇舟 【Spark亚太研究院系列丛书】Spark实战高手之路-第1章(1) 【Spark亚太研究院系列丛书】Spark实战高手之路-第1章(2) 【Spark亚太研究院系列丛书...
- 2.0MB
[源代码]Spark和Python机器学习实战_预测分析核心方法_第2版.rar
2023-10-14[源代码]Spark和Python机器学习实战_预测分析核心方法_第2版,介绍可以有效预测结果的两类核心算法,包括惩罚线性回归方法和集成方法,通过一系列的示例细节来展示针对不同的问题如何使用这些方法。结合Spark和...
- 420KB
Python大数据之Spark编程基础与提升视频课程课件PPT模板.pptx
2023-06-1204/ 第4章spark机器学习之核心应用 03/ 第3章spark机器学习之特征提取 02/ 第2章spark数据预处理与分析 01/ 第1章spark入门 06/ 第6章附:使用spark完成hadoop作业 05/ 第5章企业项目实战:使用spark机器学习库构建...
- 2.48MB
机器学习-Spark-mllib-第一节ver1.0
2022-05-05机器学习-Spark-mllib
- 402KB
Spark实验:Standalone模式安装部署(带答案)1
2022-08-031. 解压Spark安装包 2. 配置Spark环境变量 2. 修改 spark-env.sh 文件,完成以下设置: 1. 设置运行master进程的节点, e
- 2KB
2017年最新机器学习入门与实战精品高清全套视频教程附讲义作业(anaconda2 4.3Pytyhon2.7 jupyter) 70课
2018-05-04第一章Numpy前导介绍 1.1、Anconda安装 1.2、JupyterNoteBook 1.3、Numpy介绍+ndarry 1.4、ndarry的shape属性巧算 1.5、ndarray的常见创建方式 1.6、NumPy中的数据类型 1.7、NumPy数据类型2 1.8、Numpy基本操作 1.9...
- 231KB
Java第十五届蓝桥杯大赛软件JavaB组真题
2024-04-14【Java】第十五届蓝桥杯大赛软件JavaB组真题
- 38.20MB
SwitchHosts
2024-03-06切换host工具
- 55.2MB
安卓期末大作业(AndroidStudio开发),垃圾分类助手app,分为前台后台,代码有注释,均能正常运行
2023-06-04安卓期末大作业-垃圾分类助手(免积分下载) 压缩包内包含源代码,项目文档,apk文件,运行各个界面截图。app使用的是sqlite数据库,使用的核心类及其组件:Base Adapter,Fragment,View Pager,Alert Dialog.Builder,Option,Animation Draw able(关键帧动画),Media Player(视频),Count Down Timer(倒计时 广告页用),Spinner等 该分类助手的功能是管理员先登录进入后台界面,将数据录入数据库,管理员可进行增删改查操作,用户可在前台页面通过垃圾分类查垃圾也可通过垃圾查分类,可以浏览后台管理员录到数据库中的新闻。 该分类助手在上传头像时是通过跳转到手机图库选择照片,然后保存的时候是通过该图片的uri录入数据库,显示图片则是从数据库读取uri并显示。 以上所述功能均实现正常 详见 https://blog.csdn.net/weixin_59538558/article/details/131029604
- 6.98MB
Notepad++安装包
2022-07-28Notepad++中文版是一款非常有特色的编辑器,是开源软件,可以免费使用。 Notepad++中文版是 Windows操作系统下的一套文本编辑器(软件版权许可证: GPL)。Notepad++有完整的中文化接口及支持多国语言编写的功能(UTF8技术)。Notepad++中文版功能比 Windows 中的 Notepad(记事本)强大。Notepad++除了可以用来制作一般的纯文字说明文件,也十分适合编写计算机程序代码。Notepad++中文版不仅有语法高亮度显示,也有语法折叠功能,并且支持宏以及扩充基本功能的外挂模组。
- 734KB
2024北森能力测评题库.7z
2024-03-09北森能力测评
- 39.41MB
微信小程序源码-合集1.rar
2020-09-04【微信小程序-源码合集】该合集主要整理 包含交友互动、节日祝福、金融行业、旅游行业、论坛系列、美容行业!
- 9.42MB
Java面试八股文2023最新版
2023-03-14工作了一年多想跳槽了,自己整理的Java面试八股文 java面试题 2023最新整理 java八股文 高频面试题 里边包含了很多领域的java se基础、springboot springcloud MyBatis、ZooKeeper、Dubbo、Elasticsearch、Memcached、 Redis、MySQL、Spring、tomcat、Git、 Linux Nginx,以及软实力等等技术栈 希望对你们有帮助! 用最少的money换取最新最全的面试题集!
- 12.58MB
Linux Centos7 升级最新版OpenSSH-9.6p1 有脚本(支持离线)
2024-01-03包含升级的rpm文件 openssh-9.6p1.tar.gz openssl-1.1.1q.tar.gz zlib-1.3.tar.gz 以及升级脚本 sshupdate2.sh