Python数据挖掘与机器学习实战
电子书推荐
-
Python+Spark 2.0+Hadoop机器学习与大数据实战_林大贵(著)_完整高清带书签PDF压缩包 评分:
Python+Spark 2.0+Hadoop机器学习与大数据实战_林大贵(著)清华大学出版社_完整高清带书签的PDF压缩包
上传时间:2018-08 大小:101.21MB
- 246KB
python成功运行hadoop
2017-03-27python成功运行hadoop
- 12.40MB
python大数据分析与机器学习商业案例实战_人脸识别模型_编程实例课程教程.pdf
2022-02-28python大数据分析与机器学习商业案例实战_人脸识别模型_编程实例课程教程.pdf
- 138.0MB
HADOOP权威指南 第3版 PDF电子书下载 带目录书签 完整版
2018-03-22HADOOP权威指南 第3版 PDF电子书下载 带目录书签 完整版
- 36.22MB
Hadoop-Spark大数据处理技巧.pdf
2017-12-06大数据的目的是使用某种方法解决具体的问题,这本书指出了在大数据处理过程中的技巧话问题
- 164.31MB
Hadoop与Spark 肖睿+PDF
2019-08-18大数据技术让我们以一种靠前的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,很终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数据离线处理辅助系统、Spark Core、Spark SQL、Spark Streaming等知识。本书紧密结合实际应用,运用大量案例说明和实践,提炼含金量十足的开发经验。另外,本书配以多元的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等学习内容, 为读者带来多方面的学习体验。
- 101.21MB
Python+Spark 2.0+Hadoop机器学习与大数据
2021-06-08Python+Spark 2.0+Hadoop机器学习与大数据实战完整高清带书签的PDF压缩包
- 99.88MB
Hadoop Spark大数据巨量分析与机器学习整合开发实战 ,林大贵
2018-11-23Hadoop Spark大数据巨量分析与机器学习整合开发实战 ,林大贵 扫描版
- 161KB
《Hadoop大数据开发实战》教学教案—01初识Hadoop.pdf
2022-07-07《Hadoop大数据开发实战》教学教案—01初识Hadoop.pdf《Hadoop大数据开发实战》教学教案—01初识Hadoop.pdf《Hadoop大数据开发实战》教学教案—01初识Hadoop.pdf《Hadoop大数据开发实战》教学教案—01初识Hadoop.pdf...
- 210B
hadoop,spark,linux,机器学习,数据挖掘等大数据全套视频.rar
2019-11-16hadoop,spark,linux,机器学习,数据挖掘等大数据全套视频(视频+源码+课件),内涵大数据相关组件的使用
- 53KB
毕业设计-基于Hadoop+Spark的大数据金融信贷风险控系统源码.zip
2023-10-16毕业设计-基于Hadoop+Spark的大数据金融信贷风险控系统源码.zip毕业设计-基于Hadoop+Spark的大数据金融信贷风险控系统源码.zip毕业设计-基于Hadoop+Spark的大数据金融信贷风险控系统源码.zip毕业设计-基于Hadoop+...
- 175.66MB
《大数据开发工程师系列:Hadoop & Spark大数据开发实战》.pdf
2019-05-23《大数据开发工程师系列:Hadoop & Spark大数据开发实战》
- 9.21MB
python大数据分析与机器学习商业案例实战_用户评论情感分析模型_编程实例课程教程.pdf
2022-02-28python大数据分析与机器学习商业案例实战_用户评论情感分析模型_编程实例课程教程.pdf
- 5.96MB
Big Data with Apache Spark and Python 无水印pdf
2017-10-03Big Data with Apache Spark and Python 英文无水印pdf pdf所有页面使用FoxitReader和PDF-XChangeViewer测试都可以打开 本资源转载自网络,如有侵权,请联系上传者或csdn删除 本资源转载自网络,如有侵权,请联系上传者或csdn删除
- 6.15MB
Spark for Python Developers 无水印pdf 0分
2016-01-05Paperback: 146 pages Publisher: Packt Publishing - ebooks Account (February 4, 2016) Language: English ISBN-10: 1784399698 ISBN-13: 978-1784399696 Key Features Set up real-time streaming and batch data intensive infrastructure using Spark and Python Deliver insightful visualizations in a web app using Spark (PySpark) Inject live data using Spark Streaming with real-time events Book Description Looking for a cluster computing system that provides high-level APIs? Apache Spark is your answer―an open source, fast, and general purpose cluster computing system. Spark's multi-stage memory primitives provide performance up to 100 times faster than Hadoop, and it is also well-suited for machine learning algorithms. Are you a Python developer inclined to work with Spark engine? If so, this book will be your companion as you create data-intensive app using Spark as a processing engine, Python visualization libraries, and web frameworks such as Flask. To begin with, you will learn the most effective way to install the Python development environment powered by Spark, Blaze, and Bookeh. You will then find out how to connect with data stores such as MySQL, MongoDB, Cassandra, and Hadoop. You'll expand your skills throughout, getting familiarized with the various data sources (Github, Twitter, Meetup, and Blogs), their data structures, and solutions to effectively tackle complexities. You'll explore datasets using iPython Notebook and will discover how to optimize the data models and pipeline. Finally, you'll get to know how to create training datasets and train the machine learning models. By the end of the book, you will have created a real-time and insightful trend tracker data-intensive app with Spark.
- 8.32MB
python大数据分析与机器学习商业案例实战_客户流失预警模型_编程实例课程教程.pdf
2022-02-28python大数据分析与机器学习商业案例实战_客户流失预警模型_编程实例课程教程.pdf
- 16.20MB
毕业设计,基于Python+Spark+Hadoop大数据开发的用户画像电影推荐系统,内含Python完整源代码,数据库脚本
2024-01-24毕业设计,基于Python+Spark+Hadoop大数据开发的用户画像电影推荐系统,内含Python完整源代码,数据库脚本 Python+Spark+Hadoop大数据基于用户画像电影推荐系统设计 程序开发软件: Pycharm + Python3.7 + Django...
- 5.25MB
Hadoop+Spark+Hive+HBase+Oozie+Kafka+Flume+Flink+ES+Redash等详细安装部署
2022-06-221、内容概要:Hadoop+Spark+Hive+HBase+Oozie+Kafka+Flume+Flink+Elasticsearch+Redash等大数据集群及组件搭建指南(详细搭建步骤+实践过程问题总结)。 2、适合人群:大数据运维、大数据相关技术及组件初学者。 3、...
- 771B
Spark3+Clickhouse+Hadoop大数据实战课程.rar
2021-10-18分享课程-Spark3+Clickhouse+Hadoop大数据实战课程。本课程采用项目驱动的方式,以Spark3和Clickhouse技术为突破口,带领学员快速入门Spark3+Clickhouse数据分析,促使学员成为一名高效且优秀的大数据分析人才。
- 47B
大数据(hadoop+spark+hbase+zookeeper+kafka+scala+ambari)全套视频教程(花3000¥买的)
2017-06-24大数据 hadoop spark hbase ambari全套视频教程(购买的付费视频)
- 23.20MB
Hadoop+Spark生态系统操作与实践指南-余辉.pdf
2019-07-17Hadoop、Spark、hive、mapReduce经典学习资料
- 1.75MB
Hadoop with Python
2016-10-24Hadoop is mostly written in Java, but that doesn't exclude the use of other programming languages with this distributed storage and processing framework, particularly Python. With this concise book, you'll learn how to use Python with the Hadoop Distributed File System (HDFS), MapReduce, the Apache Pig platform and Pig Latin script, and the Apache Spark cluster-computing framework.
- 247KB
Hadoop中的Python框架的使用指南
2020-12-25最近,我加入了Cloudera,在这之前,我在计算生物学/基因组学上已经工作了差不多10年。我的分析工作主要是利用Python语言和它很棒的科学计算栈来进行的。但Apache Hadoop的生态系统大部分都是用Java来实现的,也是为Java准备的,这让我很恼火。所以,我的头等大事变成了寻找一些Python可以用的Hadoop框架。 在这篇文章里,我会把我个人对这些框架的一些无关科学的看法写下来,这些框架包括: Hadoop流 mrjob dumbo hadoopy pydoop 其它 最终,在我的看来,Hadoop的
- 300KB
用Spark进行大数据处理之机器学习篇
2021-01-27在本篇文章,作者将讨论机器学习概念以及如何使用SparkMLlib来进行预测分析。后面将会使用一个例子展示SparkMLlib在机器学习领域的强悍。Spark机器学习API包含两个package:spark.mllib和spark.ml。spark.mllib包含基于弹性数据集(RDD)的原始Spark机器学习API。它提供的机器学习技术有:相关性、分类和回归、协同过滤、聚类和数据降维。spark.ml提供建立在DataFrame的机器学习API,DataFrame是SparkSQL的核心部分。这个包提供开发和管理机器学习管道的功能,可以用来进行特征提取、转换、选择器和机器学习算
- 145KB
大数据框架对比:Hadoop、Storm、Samza、Spark和Flink
2021-02-01大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模,以及价值在最近几年才经历了大规模扩展。在之前的文章中,我们曾经介绍过有关大数据系统的常规概念、处理过程,以及各种专门术语,本文将介绍大数据系统一个最基本的组件:处理框架。处理框架负责对系统中的数据进行计算,例如处理从非易失存储中读取的数据,或处理刚刚摄入到系统中的数据。数据的计算则是指从大量单一数据点中提取信息和见解的过程。下文将介绍这些框架:仅批处理框架:
- 736B
Spark 2.x + Python 大数据机器学习实战
2021-08-06Spark 2.x + Python 大数据机器学习实战,本课程系统讲解如何在Spark2.0上高效运用Python来处理数据并建立机器学习模型,帮助读者开发并部署高效可拓展的实时Spark解决方案。
- 16.22MB
Python+Spark+Hadoop大数据基于用户画像电影推荐系统设计
2023-11-01本系统是以Django作为基础框架,采用MTV模式,数据库使用MySQL和Redis,以从豆瓣平台爬取的电影数据作为基础数据源,主要基于用户的基本信息和使用操作记录等行为信息来开发用户标签,并使用Hadoop、Spark大数据组件...
- 31KB
Hadoop大数据开发实战-教学大纲.pdf
2019-12-23因此,学习Hadoop技术是从事大数据行业工作所必不可少的一步。 二、 课程的任务 通过本课程的学习,使学生学会搭建Hadoop完全分布式集群,掌握HDFS的原理和基础操作,掌握MapReduce原理架构、MapReduce程序的编写。...
- 100.0MB
Hadoop Spark大数据处理技巧
2018-04-15大数据开发技巧,包括聚类、关联、回归、共同好友算法等。有两部分,要同时解压才有用。
- 765B
Spark3+Clickhouse+Hadoop大数据实战视频课程(2021新课).rar
2021-10-22分享课程——Spark3+Clickhouse+Hadoop大数据实战课程,2021新课,提供代码、课件和软件下载。 另外通过项目驱动,掌握Spark框架的精髓,教导Spark源码查看的技巧;会学到Spark性能优化的核心要点,成为企业急缺的...
- 49B
徐老师大数据培训Hadoop+HBase+ZooKeeper+Spark+Kafka+Scala+Ambari
2018-01-26徐老师大数据培训Hadoop+HBase+ZooKeeper+Spark+Kafka+Scala+Ambari