下载 >  开发技术 >  其它 > 大数据量海量数据处理.pdf
4

大数据量海量数据处理.pdf

大数据量海量数据处理.pdf 很值得一看,收获颇多
2011-11-15 上传大小:187KB
想读
分享
收藏 (1) 举报

评论 共12条

zhangjianzh 还可以吧,不是太新的东西
2017-09-14
回复
ljty318 方法没有太多的新东西
2015-01-07
回复
lemenlee 对面试有一定帮组
2014-11-02
回复
Hadoop大数据处理 完整版 pdf

作者: 刘军 出版社: 人民邮电出版社 出版年: 2013-9-1 页数: 289 装帧: 平装 ISBN: 9787115323248 《Hadoop大数据处理》以大数据处理系统的三大关键要素——“存储”、“计算”与“容错”为起点,深入浅出地介绍了如何使用Hadoop这一高性能分布式技术完成大数据处理任务。本书不仅包含了使用Hadoop进行大数据处理的实践性知识和示例,还以图文并茂的形式系统性地揭示了Hadoop技术族中关键组件的运行原理和优化手段,为读者进一步提升Hadoop使用技巧和运行效率提供了颇具价值的参考。《Hadoop大数据处理》共10章,涉及的主题包括大数据处理概论、基于Hadoop的大数据处理框架、MapReduce计算模式、使用HDFS存储大数据、HBase大数据库、大数据的分析处理、Hadoop环境下的数据整合、Hadoop集群的管理与维护、基于MapReduce的数据挖掘实践及面向未来的大数据处理技术。最后附有一个在Windows环境下搭建Hadoop开发及调试环境的参考手册。《Hadoop大数据处理》适合需要使用Hadoop处理大数据的程序员、架构师和产品经理作为技术参考和培训资料,也可作为高校研究生和本科生教材。

立即下载
《Hadoop海量数据处理》高清完整PDF版

本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。

立即下载
Hadoop海量数据处理 技术详解与项目实战 PDF电子书

Hadoop海量数据处理 技术详解与项目实战 PDF电子书 Hadoop海量数据处理 技术详解与项目实战 PDF电子书

立即下载
Spark大数据处理:技术、应用与性能优化 (大数据技术丛书).pdf

Spark大数据处理:技术、应用与性能优化 (大数据技术丛书).pdf,完整版的,需要的赶快下载

立即下载
Spark大数据处理:技术、应用与性能优化(完整版全pdf) 百度云下载

Spark大数据处理:技术、应用与性能优化(完整版全pdf) 百度云链接下载 大数据必备书籍

立即下载
Spark大数据处理技术-完整版

这个压缩文件是Spark大数据处理技术-完整版,内容是从淘宝上买的,欢迎大家下载学习。

立即下载
数据算法:Hadoop/Spark大数据处理技巧.pdf 中文扫描版 带标签

《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。 主要内容包括: ■ 完成超大量交易的购物篮分析。 ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。 ■ 使用超大基因组数据完成DNA和RNA测序。 ■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。 ■ 推荐算法和成对文档相似性。 ■ 线性回归、Cox回归和皮尔逊(Pearson)相关分析。 ■ 等位基因频率和DNA挖掘。 ■ 社交网络分析(推荐系统、三角形计数和情感分析)。 适读人群 :这本书面向了解Java基础知识并且想使用Hadoop和Spark 开发MapReduce 算法(数据挖掘、机器学习、生物信息技术、基因组和统计领域)和解决方案的软件工程师、软件架构师、数据科学家和应用开发人员。 目录 第1章二次排序:简介 19 第2章二次排序:详细示例 42 第3章 Top 10 列表 54 第4章左外连接 96 第5章反转排序 127 第6章移动平均 137 第7章购物篮分析 155 第8章共同好友 182 第9章使用MapReduce实现推荐引擎 201 第10章基于内容的电影推荐 225 第11章使用马尔可夫模型的智能邮件营销 .253 第12章 K-均值聚类 282 第13章 k-近邻 296 第14章朴素贝叶斯 315 第15章情感分析 349 第16章查找、统计和列出大图中的所有三角形 354 第17章 K-mer计数 375 第18章 DNA测序 390 第19章 Cox回归 413 第20章 Cochran-Armitage趋势检验 426 第21章等位基因频率 443 第22章 T检验 468 第23章皮尔逊相关系数 488 第24章 DNA碱基计数 520 第25章 RNA测序 543 第26章基因聚合 553 第27章线性回归 586 第28章 MapReduce和幺半群 600 第29章小文件问题 622 第30章 MapReduce的大容量缓存 635 第31章 Bloom过滤器 651Bloom

立即下载
深入理解大数据 大数据处理与编程实践.pdf(中文高清版)

【更多关于《大数据》资料,加qq群:931257845领取!】 本书在总结多年来MapReduce并行处理技术课程教学经验和成果的基础上,与业界著名企业Intel公司的大数据技术和产品开发团队和资深工程师联合,以学术界的教学成果与业界高水平系统研发经验完美结合,在理论联系实际的基础上,在基础理论原理、实际算法设计方法以及业界深度技术三个层面上,精心组织材料编写而成。 全书的主要内容包括: ■ 大数据处理技术与Hadoop MapReduce简介 ■ Hadoop系统的安装和操作管理 ■ 大数据分布式文件系统HDFS ■ Hadoop MapReduce并行编程模型、框架与编程接口 ■ 分布式数据库HBase ■ 分布式数据仓库Hive ■ Intel Hadoop系统优化与功能增强 ■ MapReduce基础算法程序设计 ■ MapReduce高级程序设计技术 ■ MapReduce机器学习与数据挖掘基础算法 ■ 大数据处理算法与应用编程案例

立即下载
Hadoop-Spark大数据处理技巧.pdf

大数据的目的是使用某种方法解决具体的问题,这本书指出了在大数据处理过程中的技巧话问题

立即下载
数据算法 Hadoop Spark大数据处理技巧 (完整版)

破解基因组的奥秘实在是奥妙无穷,他把知识、思维方法和科技能力紧密融合在一起,将带来变革性的发展。 不过,这种变革还需要联合和协同,而协同少不了深层次的协作。从科学家到软件工程师,从学术界到企业界, 我们需要通力合作,朝着基因主导的未来稳步前进。 MapReduce\Hadoop和Spark是帮助我们大规模使用基因测序以及存储、处理和分析基因组“大数据”的关键技术。 Mahmoud的这本书采用一种简明而实用的方式介绍了这些内容。本书就像一盏灯,为数据科学家、软件工程师以及临床医生 照亮了破解基因组奥秘的道路。在这本书的帮助下,人类健康将进入一个讲求精确、个性化和转化的新纪元。 --Jay Flatley(Illumina CEO)

立即下载
深入理解大数据大数据处理与编程实践 完整版.pdf

深入理解大数据大数据处理与编程实践 完整版.pdf深入理解大数据大数据处理与编程实践 完整版.pdf

立即下载
企业大数据处理:Spark、Druid、Flume与Kafka应用实践(完整超清版).pdf

这是一本立足于企业真实的商用项目来讲解如何高效从事大数据实践的著作。技术层面,从全栈的角度系统梳理和详尽讲解了大数据的核心技术,包括Spark、Druid、Flume、Kafka等,让我们在纷繁复杂的技术中少走弯路......

立即下载
Hadoop海量数据处理:技术详解与项目实战(第2版)

本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。基础篇详细介绍了Hadoop、YARN、MapReduce、HDFS、Hive、Sqoop和HBase,并深入探讨了Hadoop的运维和调优;应用篇则包含了一个具有代表性的完整的基于Hadoop的商业智能系统的设计和实现;结束篇对全书进行总结,并对技术发展做了展望。 本书由浅至深,从理论基础到项目实战,适合Hadoop的初学者阅读,也可以作为高等院校相关课程的教学参考书。 本书主要内容 包含了Hadoop新版本的几乎所有主要特性,是Hadoop目前成熟的形态。 深入介绍了NoSQL架构模式、HBase的架构和实现,以及HBase的高级特性。 深入介绍了统一资源管理和调度平台的范型和YARN实现。 深入介绍了Hadoop、HBase性能调优,满足海量数据处理的需求。 Hadoop海量数据处理 技术详解与项目实战(第2版) 目录 第1章 绪论 2 第2章 环境准备 22 第3章 Hadoop的基石:HDFS 52 第4章 YARN:统一资源管理和调平台 80 第5章 分而治之的智慧:MapReduce 97 第6章 SQL on Hadoop:Hive 142 第7章 SQL to Hadoop : Sqoop 174 第8章 HBase:HadoopDatabase 187 第9章 Hadoop性能调优和运维 215 第10章 在线图书销售商业智能系统 238 .........

立即下载
企业大数据处理:Spark、Druid、Flume与Kafka应用实践(超清完整版).pdf

这是一本立足于企业真实的商用项目来讲解如何高效从事大数据实践的著作。技术层面,从全栈的角度系统梳理和详尽讲解了大数据的核心技术,包括Spark、Druid、Flume、Kafka等,让我们在纷繁复杂的技术中少走弯路......

立即下载
数据算法 Hadoop Spark大数据处理技巧 中文完整版 高清带书签

Hadoop/Spark大数据处理技巧英文电子版 高清原版 Hadoop/Spark大数据处理技巧电子版

立即下载
大数据分析的道与术 pdf电子书

大数据分析的道与术 pdf电子书,如果有侵权,请联系删除

立即下载
企业大数据处理:Spark、Druid、Flume与Kafka应用实践

大数据技术丛书《企业大数据处理:Spark、Druid、Flume与Kafka应用实践》

立即下载
企业大数据处理:Spark、Druid、Flume与Kafka应用实践(超清完整版+目录)_wrapper.pdf

这是一本立足于企业真实的商用项目来讲解如何高效从事大数据实践的著作。技术层面,从全栈的角度系统梳理和详尽讲解了大数据的核心技术,包括Spark、Druid、Flume、Kafka等,让我们在纷繁复杂的技术中少走弯路......

立即下载
Hadoop大数据处理_刘军

87MB。《Hadoop大数据处理》以大数据处理系统的三大关键要素――“存储”、“计算”与“容错”为起点深入浅出地介绍了如何使用Hadoop这一高性能分布式技术完成大数据处理任务。本书不仅包含了使用Hadoop进行大数据处理的实践性知识和示例还以图文并茂的形式系统性地揭示了Hadoop技术族中关键组件的运行原理和优化手段为读者进一步提升Hadoop使用技巧和运行效率提供了颇具价值的参考。《Hadoop大数据处理》共10章涉及的主题包括大数据处理概论、基于Hadoop的大数据处理框架、MapReduce计算模式、使用HDFS存储大数据、HBase大数据库、大数据的分析处理、Hadoop环境下的数据整合、Hadoop集群的管理与维护、基于MapReduce的数据挖掘实践及面向未来的大数据处理技术。最后附有一个在Windows环境下搭建Hadoop开发及调试环境的参考手册。《Hadoop大数据处理》适合需要使用Hadoop处理大数据的程序员、架构师和产品经理作为技术参考和培训资料也可作为高校研究生和本科生教材。

立即下载
数据算法: Hadoop+Spark大数据处理技巧.pdf

数据算法: Hadoop+Spark大数据处理技巧,pdf,高清,带书签,下载下来解压即可

立即下载
关闭
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

大数据量海量数据处理.pdf

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可返还被扣除的积分

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: