• 数据化思维:你必须了解的机器学习、数据挖掘和数据分析(英文版)

    本书是一本数据思维培训指南,介绍从数据中提取有用知识的一套基本原理。即使没有任何专业背景的读者,也将能从本书中获取以下技能:预测数据科学前景;参与数据科学项目;富有见地地同数据科学家和其他投资人探讨数据科学等。

    4
    0
    18.75MB
    2018-08-05
    14
  • Python网络数据采集(第二版英文版)

    网络上的数据量越来越大,单靠浏览网页获取信息越来越困难,如何有效地提取并利用信息已成为一个巨大的挑战。本书采用简洁强大的Python语言,全面介绍网络数据采集技术,教你从不同形式的网络资源中自由地获取数据。你将学会如何使用Python脚本和网络API一次性采集并处理成千上万个网页上的数据。

    0
    0
    6.35MB
    2018-08-05
    9
  • Spark in Action

    Spark in Action teaches you the theory and skills you need to effectively handle batch and streaming data using Spark. You'll get comfortable with the Spark CLI as you work through a few introductory examples. Then, you'll start programming Spark using its core APIs. Along the way, you'll work with structured data using Spark SQL, process near-real-time streaming data, apply machine learning algorithms, and munge graph data using Spark GraphX. For a zero-effort startup, you can download the preconfigured virtual machine ready for you to try the book's code.

    0
    59
    10.97MB
    2018-08-05
    10
  • Spark: The Definite Guide

    We designed this book mainly for data scientists and data engineers looking to use Apache Spark. The two roles have slightly different needs, but in reality, most application development covers a bit of both, so we think the material will be useful in both cases. Specifically, in our minds, the data scientist workload focuses more on interactively querying data to answer questions and build statistical models, while the data engineer job focuses on writing maintainable, repeatable production applications-either to use the data scientist’s models in practice, or just to prepare data for further analysis (e.g., building a data ingest pipeline). However, we often see with Spark that these roles blur. For instance, data scientists are able to package production applications without too much hassle and data engineers use interactive analysis to understand and inspect their data to build and maintain pipelines.

    0
    83
    7.88MB
    2018-08-05
    12
  • Hadoop数据分析(英文版)

    通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,第一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;第二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。 书中主要内容如下: •Hadoop和集群计算背后的核心概念 •使用设计模式和并行分析算法创建分布式数据分析作业 •在分布式环境下使用Apache Hive和HBase进行数据管理、数据挖掘和数据仓储 •使用Sqoop和Apache Flume从关系数据库采集数据 •使用Apache Pig和Spark DataFrame编写复杂的Hadoop和Spark应用程序 •通过Spark MLlib运用分类、聚类和协同过滤等机器学习技术

    0
    0
    6.1MB
    2018-04-28
    32
  • 数据科学:R语言实现(英文原版)

    本书介绍了R语言在数据科学领域应用的方方面面,包括数据处理、数据操作、数据可视化、概率模拟、序列预测、频繁项集挖掘、监督式算法和非监督式算法等。 本书注重对R语言程序包的介绍和使用,可操作性强,并且提供了关于高级技术的扩展阅读资料,供学有余力的读者钻研探讨。本书适合数据科学相关专业的本科生和研究生使用,也可作为数据领域从业人员的参考书。

    0
    0
    32.32MB
    2018-04-21
    23
  • 利用Python进行数据分析(中文原版第二版)

    《利用Python进行数据分析》适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。将IPython这个交互式Shell作为你的首要开发环境。

    0
    0
    12.53MB
    2018-04-21
    10
  • 算法图解(英文原版)

    本书示例丰富,图文并茂,以简明易懂的方式阐释了算法,旨在帮助程序员在日常项目中更好地利用算法为软件开发助力。前三章介绍算法基础,包括二分查找、大O 表示法、两种基本的数据结构以及递归等。余下的篇幅将主要介绍应用广泛的算法,具体内容包括:面对具体问题时的解决技巧,比如何时采用贪婪算法或动态规划;散列表的应用;图算法;K 最近邻算法。

    5
    0
    24.82MB
    2018-04-21
    23
  • Data Wrangling with Pandas Cheat Sheet

    使用Pandas进行数据清洗 - Data Wrangling with Pandas Cheat Sheet

    0
    203
    171KB
    2017-10-11
    9
  • Programming C# 4.0 6th.Edition

    Programming C# 4.0 6th.Edition

    0
    71
    7.99MB
    2010-10-18
    9
上传资源赚积分or赚钱