Hadoop权威指南(英文原版)

-
Hadoop权威指南(英文原版)Hadoop权威指南(英文原版)Hadoop权威指南(英文原版)
Hadoop The Definitive Guide Tom White orewor rd by doug cutting ○ REILLY Beijing· Cambridge: Farnham·Kdln· Sebastopol· Taipei· Tokyo Hadoop: The Definitive Guide by Tom white Copyright o 2009 Tom White. All rights reserved Printed in the United States of america Published by O Reilly Media, Inc, 1005 Gravenstein Highway North, Sebastopol, CA 95472 O'Reilly books may be purchased for educational, business, or sales promotional use. Online editions arealsoavailableformosttitles(http://my.safaribooksonline.com).Formoreinformationcontactour corporate/institutionalsalesdepartment(800)998-9938orcorporate@oreilly.com Editor: Mike Loukides Indexer: Ellen Troutman Zaig Production editor: Loranah Dimant Cover Designer: Karen montgomery Proofreader: Nancy Rotary Interior Designer: David Futato Illustrator: Robert romano Printing History: June 2009 First edition Nutshell Handbook, the Nutshell Handbook logo, and the O Reilly logo are registered trademarks of O'Reilly Media, Inc. Hadoop: The Definitive Guide, the image of an African elephant, and related trade dress are trademarks of O'Reilly Media, Inc Many of the designations used by manufacturers and sellers to distinguish their products are claimed as rademarks. Where those designations appear in this book, and O'Reilly Media, Inc. was aware of a trademark claim, the designations have been printed in caps or initial caps While every precaution has been taken in the preparation of this book, the publisher and author assume no responsibility for errors or omissions, or for damages resulting from the use of the information con- tained herein Repkover This book uses RepkoverTM, a durable and flexible lay-flat binding ISBN:978-0-596-52197-4 1243455573 For Eliane. Emilia, and lottie Table of contents reword XIl Preface XV 1. Meet Hadoop Data Data Storage and analysis Comparison with Other Systems RDBMS Grid ce Ing Volunteer Computing a Brief History of Hadoop The apache Hadoop project 12 2. Mapreduce.............................. 15 A Weather Dataset 15 Data format 15 Analyzing the Data with Unix tools 17 analyzing the data with hadoop Map and reduce 18 ava mapReduce 20 Scaling Out 27 Data flo 27 Combiner functions 29 Running a distributed Mapreduce Job 32 Hadoop Streaming 32 R 33 Python Hadoop Pipes 36 Compiling and running 38 3. The hadoop Distributed filesystem The Design of HDFS 41 HDFS Concepts 42 Blocks 42 Namenodes and datanodes 44 The Command-Line Interface Basic Filesystem Operations 45 Hadoop filesystems 47 Interfaces 49 The Java Interface 51 Reading Data from a Hadoop url 51 Reading Data Using the File System API 52 Writing Data 56 Directories Querying the Filesystem 58 Deleting Data Data Flo 63 Anatomy of a File read 63 Anatomy of a File Write 66 Coherency mode Parallel Copying with distcp Keeping an hDFS Cluster Balanced 71 Hadoop archives 71 Using Hadoop archiv Limitations Hadoop 1/0 Data Integrity 75 Data Integrity in HDFS ocalFileSystem 76 Checksum FileSystem Compression 79 Compression and input splits 83 Using Compression in MapReduce Serialization The Writable interface Writable classes 89 Implementing a Custom Writable 96 Serialization frameworks 101 File-Based Data structures 103 Sequence File 103 MapFile 110 ⅵ i Table of Contents 5. Developing a MapReduce Application 115 The Configuration API 116 Combining resources Variable expansion 117 Configuring the Development Environment 118 Managing Configuration 118 GenericOptions Parser, Tool, and ToolRunner 121 Writing a Unit Test 123 apper 124 Reducer 126 Running locally on Test data 127 Running a Job in a local Job runner 127 Testing the Driver 130 Running on a cluster 132 ging 132 Launching a Job 132 The MapReduce Web UI 134 Retrieving the results 136 Debugging a Job 138 Using a Remote debugger 144 Tuning a Job 145 Profiling tasks g 146 MapReduce Workflows 149 Decomposing a Problem into Map Reduce Jobs 149 Running dependent Jobs 151 6. How MapReduce Works 153 Anatomy of a MapReduce Job run 153 Job Submission 153 Job Initialization 155 Task assignment Task execution 156 Progress and Status Updates 156 Job Completion 158 F allures 159 Task failure 159 Tasktracker Failure 161 Jobtracker Failure 161 Job scheduling 161 The Fair Scheduler 162 Shuffle and sort 163 The Map sid P 163 The Reduce Side 164 Table of contents|ⅶi Configuration Tuning 166 Task execution 168 Speculative execution 169 Task jvm reuse 170 Skipping Bad Records 171 The Task execution environment 172 7. Map Reduce Types and Formats ,,175 Reduce t The Default MapReduce job 178 Input Formats 184 Input Splits and records 185 ext Input 196 Binary input 199 Multiple Inputs 200 Database Input(and Output 201 Output Formats 202 Text Output 202 Binary output 203 Multiple outputs 203 Lazy output 210 Database Output 210 8. MapReduce Features.........................211 Counters 211 Built-in counters 211 User-Defined Java Counters 213 User-Defined Streaming Counters 218 Sorting 218 reparation 218 Partial sort 219 Total sort 223 Secondary sort 227 Joins 233 e oins Reduce-Side joins 235 Side data distribution 238 Using the Job Configuration 238 Distributed cache 239 MapReduce library classes 243 9. Setting Up a Hadoop Cluster............. 245 Cluster Specification 245 ⅶ ii Table of Contents

195.40MB
Hadoop权威指南(第四版)中英文+资料合集
2019-02-21自己收集的电子书,没有密码,下载即可打开查看。下载后请帮评论。谢谢。 Hadoop权威指南第四版英文原版、中文版以及配套的代码,内容以Hadoop2.x为主,包含一些hadoop的stable版本的新
Hadoop权威指南 第四版 英文版 Hadoop_The Definitive Guide 4th Edition下载_course
2018-06-21Hadoop权威指南 第四版 英文版 Hadoop_The Definitive Guide 4th Edition 带书签完整图片 相关下载链接://download.csdn.net/downlo
7.17MB
Hadoop权威指南(第三版)英文版.pdf
2018-11-07Hadoop权威指南(第三版)英文版。 这个是原始的带完整目录书签的高清pdf版本,内容可以复制的哦。
8.51MB
Hadoop权威指南 英文版
2018-01-13本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布
11.77MB
Hadoop权威指南 第四版 高清 pdf(英文)原版下载
2017-09-02大数据越来越热。Hadoop技术是大数据技术的基础。 Hadoop权威指南第四版英文原版,内容以Hadoop2.x为主还包含一些hadoop的stable版本的新特性 掌握了大数据技术,就意味着可以轻
192.57MB
Hadoop权威指南第四版中文版+英文原版
2018-04-13Hadoop权威指南第四版中文版+英文原版,中文版为2017年7月出版。高清,带书签。
11.77MB
Hadoop权威指南(第四版)英文版.pdf
2017-09-29Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 大数据学习书籍
11.79MB
Hadoop权威指南(第四版)pdf英文版
2015-10-16在站内搜到一个网页版的,赶紧看着不如PDF方便,正好手头有,就传上来,希望能有用。
4.57MB
hadoop权威指南第四版英文原版
2018-05-20对应上一个hadoop权威指南第四版中文版的英文原版,这是第二个资源,第三个资源是对应这本书的源码,但也是作为一个独立的资源上传的
8.34MB
Hadoop权威指南(第四版)英文版-带书签
2019-04-10Hadoop权威指南(第四版)英文版,高清,并带书签,方便大家阅读
3.32MB
Hadoop权威指南(英文原版)
2010-09-13一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。
11.7MB
Hadoop权威指南第四版-英文版
2015-12-14Hadoop权威指南第四版 原版,805页。
41.65MB
Hadoop权威指南第三版(中文+英文+源码)
2017-09-14Hadoop权威指南第三版,包括中文版和英文版两本以及源码,含完整书签,中文版为高清扫描版,英文版为文字版,附完整源码。
11.74MB
Hadoop权威指南. 第4版英文版
2018-06-11本书结合理论和实践,由浅入深,全方位介绍了Hadoop 这一高性能的海量数据处理和分析平台。全书5部分24 章,第Ⅰ部分介绍Hadoop 基础知识,第Ⅱ部分介绍MapReduce,第Ⅲ部分介绍Hado
hadoop权威指南第四版中英文pdf及源码下载_course
2018-08-13hadoop权威指南第四版中英文pdf及源码,内容以Hadoop2.x为主,包含一些hadoop的stable版本的新特性,与以前版本比较增加了介绍YARN , Parquet , Flume, Cr
10.95MB
Hadoop权威指南(第四版)高清英文版
2017-12-06Hadoop权威指南(第3版) 修订版(带目录书签) Hadoop权威指南(第3版) 修订版(带目录书签)
192.48MB
hadoop权威指南第四版(中文版-英文版)高清
2018-06-24hadoop权威指南第四版英文原版、中文版内容以Hadoop2.x为主,包含一些hadoop的stable版本的新特性,与以前版本比较增加了介绍YARN , Parquet , Flume, Crun
Hadoop权威指南 英文版下载_course
2018-12-11英文版 ,Hadoop权威指南,Hadoop入门书籍。。。。。。。 相关下载链接://download.csdn.net/download/test_c_/10843535?utm_source=bb
手把手教你蓝牙协议栈入门
2020-07-16本课程定位是:引领想学习蓝牙协议栈的学生或者从事蓝牙,但是对蓝牙没有一个系统概念的工程师快速入门 课程是多年从事蓝牙经验总结出来的,希望能让你看完有一种醍醐灌顶的感觉。 不要在摸着石头过河了·学习完这些你肯定还是要继续学习蓝牙协议栈,但是至少懂了蓝牙的一些概念以及适合高效的学习方法 本课程一共分为4个小节: 1)蓝牙教程计划.mp4 ,主要介绍下我们的视频规划以及后续的蓝牙教程规划 2)蓝牙的前生后世.mp4 主要介绍下蓝牙的产生背景概念,以及蓝牙从开始产生到现在最新的5.2的发展过程,新赠的功能特性 3)市面蓝牙架构调查.mp4 主要介绍市面蓝牙产品的架构以及HCI蓝牙芯片的详细架构,让你对蓝牙有一个整体的认识,对于后续做蓝牙产品选型大有帮助 4)快速学习蓝牙文档介绍_工具介绍.mp4 主要介绍HCI蓝牙芯片的协议栈以及profile获取途径以及学习蓝牙的高效工具,引领你快速找到适合自己的方法来学习蓝牙
C++入门基础视频精讲
2018-09-28本课程讲述了c++的基本语言,进阶语言,以实战为基准,高效率传递干货, 教会学员命令行编译直击底层过程,现场编码 并且掌握各种排错思路
Python数据殿堂:数据分析与数据可视化
2020-01-02【入门基础+轻实战演示】【讲授方式轻松幽默、有趣不枯燥、案例与实操结合,与相关课程差异化】利用python进行数据处理、 分析,并结合大量具体的例子,对每个知识进行实战讲解,本课程通过大量练习和案例对各个知识点技能进行详细讲解。通过本 课程,学生将懂得pandas、numpy、matplotlib等数据分析工具;通过实战,学生将了解标准的数据分析流程,学会使用可视化的 方法展示数据及结果。
《C语言/C++学习指南》语法篇(从入门到精通)
2015-06-03一门初级、从入门到精通的C语言C++语法教程,由毕业于清华大学的业内人士执课。从简单的HelloWorld入门程序,到深入的C语言C++核心概念,均为您娓娓道来,言之必详、听之必懂。让C语言C++编程变得简单,让C语言C++编程变得有趣,让喜欢C语言C++的人学会C语言C++!
9KB
侯捷C++全套课程视频资源
2019-06-06侯捷全套课程,C++11新标准,侯捷 - C++面向对象高级开发,侯捷 - STL和泛型编程,C++内存管理_侯捷
4天搞定Spring核心原理训练营
2020-06-17本课程主要是分享当前互联网Java架构及高级热门技术,由业内技术大牛,行业及实战经验丰富的讲师进行技术分享。其中涵盖redis/mongodb/dubbo/zookeeper/kafka 高并发、高可用、分布式、微服务技术。
-
学院
跟我练内测小分队学习礼包
跟我练内测小分队学习礼包
-
博客
JDBC连接数据库,并实现对数据库的增删改操作
JDBC连接数据库,并实现对数据库的增删改操作
-
下载
阿里巴巴开发手册-最新版.pdf
阿里巴巴开发手册-最新版.pdf
-
博客
正则表达式匹配非字母或者数字
正则表达式匹配非字母或者数字
-
学院
【数据分析-随到随学】Hadoop数据分析
【数据分析-随到随学】Hadoop数据分析
-
下载
STM32的Modbus学习
STM32的Modbus学习
-
学院
单片机完全学习课程全五季套餐
单片机完全学习课程全五季套餐
-
博客
2021.1.18 光子芯片神经网络survey
2021.1.18 光子芯片神经网络survey
-
学院
微服务系列第七十一季-Spring入门
微服务系列第七十一季-Spring入门
-
博客
React17+React Hook+TS4 最佳实践 仿 Jira 企业级项目
React17+React Hook+TS4 最佳实践 仿 Jira 企业级项目
-
学院
(新)备战2021软考网络工程师终极解密培训套餐
(新)备战2021软考网络工程师终极解密培训套餐
-
学院
RabbitMQ消息中间件实战(附讲义和源码)
RabbitMQ消息中间件实战(附讲义和源码)
-
下载
一个文件夹解决nvm和nodejs
一个文件夹解决nvm和nodejs
-
下载
2021适用三级网络技术.rar
2021适用三级网络技术.rar
-
博客
jquery使用serialize()出现中文乱码怎么办
jquery使用serialize()出现中文乱码怎么办
-
下载
InsightToolkit-5.1.2.zip
InsightToolkit-5.1.2.zip
-
学院
(新)备战2021软考系统集成学习套餐
(新)备战2021软考系统集成学习套餐
-
学院
Kotlin协程极简入门与解密
Kotlin协程极简入门与解密
-
博客
Ruby 如何创建模块变量?
Ruby 如何创建模块变量?
-
学院
(新)备战2021软考网络工程师历年真题培训套餐
(新)备战2021软考网络工程师历年真题培训套餐
-
下载
windows xp3 sam
windows xp3 sam
-
博客
Ubuntu16.04编译Android10源码并刷机Pixel
Ubuntu16.04编译Android10源码并刷机Pixel
-
博客
smtp是什么邮件的协议
smtp是什么邮件的协议
-
博客
一篇让你搞定面试中的http\https的连接过程(输入url会发生什么)
一篇让你搞定面试中的http\https的连接过程(输入url会发生什么)
-
博客
集合论
集合论
-
博客
python json.dumps中文乱码问题解决
python json.dumps中文乱码问题解决
-
学院
【数据分析-随到随学】互联网行业业务指标及行业数
【数据分析-随到随学】互联网行业业务指标及行业数
-
博客
Discourse 如何设置 API 的 key
Discourse 如何设置 API 的 key
-
下载
linux进程的最大线程数 及最大进程数.zip
linux进程的最大线程数 及最大进程数.zip
-
博客
浅谈λ演算与Python的lambda函数
浅谈λ演算与Python的lambda函数