hadoop权威指南

-
hadoop权威指南 英文版,非影印版。
SECOND EDITION Hadoop: The definitive guide Tom White foreword by doug cutting O REILLY Beijing· Cambridge· Farnham·Koln· Sebastopol· Tokyo Hadoop: The Definitive Guide Second Edition by Tom white Copyright o 2011 Tom White. All rights reserved Printed in the United States of america Published by O Reilly Media, Inc, 1005 Gravenstein Highway North, Sebastopol, CA 95472 O'Reilly books may be purchased for educational, business, or sales promotional use. Online editions arealsoavailableformosttitles(http://my.safaribooksonline.com).Formoreinformationcontactour corporate/institutionalsalesdepartment:(800)998-9938orcorporate@oreilly.com Editor: Mike Loukides Indexer jay book Services Production editor: Adam zaremba Cover designer Karen montgomery Proofreader: Diane ll grande Interior Designer: David Futato Illustrator: Robert ro Printing History: June 2009 First edition October 2010: Second edition Nutshell Handbook, the Nutshell Handbook logo, and the O Reilly logo are registered trademarks of O'Reilly Media, Inc. Hadoop: The Definitive Guide, the image of an African elephant, and related trade dress are trademarks of O'Reilly Media, Inc Many of the designations used by manufacturers and sellers to distinguish their products are claimed as rademarks. Where those designations appear in this book, and O'Reilly Media, Inc. was aware of a trademark claim, the designations have been printed in caps or initial caps While every precaution has been taken in the preparation of this book, the publisher and author assume no responsibility for errors or omissions, or for damages resulting from the use of the information con- tained herein ISBN:978-1-449-38973-4 SB 1285179414 For Eliane. Emilia, and lottie Table of contents Foreword XV Preface 1. Meet hadoop… Data Data Storage and analysis Comparison with Other Systems RDBMS Grid Computing 134468 Volunteer Computing A Brief History of Hadoop Apache Hadoop and the Hadoop Ecosystem 12 2. Mapreduce A Weather Dataset 15 Data format Analyzing the data with Unix Tools 17 analyzing the data with hadoop 18 Map and reduce Java Mapreduce 20 caling out 27 Data flow 28 Combiner functions 30 Running a distributed Mapreduce Job Hadoop Streaming 33 Ruby 33 Python 36 P 37 Compiling and running 38 3. The hadoop Distributed filesystem 41 The Design of HDFS 41 HDFS Concepts 43 Blocks 43 Namenodes and datanodes 44 The Command-Line Interface Basic Filesystem Operations 46 Hadoop filesystems 47 Interfaces 49 The Java Interface 51 Reading Data from a Hadoop url 51 Reading Data Using the File System API 52 Writing Data Directories Querying the Filesystem 57 Deleting Data Data flow 62 Anatomy of a File read 62 Anatomy of a File Write 6 Coherency mode Parallel Copying with distcp Keeping an hDFS Cluster Balanced 71 Hadoop archives 71 Using Hadoop archiv Limitations 4. Hadoop /0 Data Integrity 75 Data Integrity in HDFS ocalFileSystem 76 Checksum FileSystem Compression 78 Compression and input splits 83 Using Compression in MapReduce Serialization The Writable interface Writable classes 89 Implementing a Custom Writable 96 Serialization frameworks 101 Avro 103 File-Based Data Structures 116 Sequence file 116 ⅵ i Table of Contents aprIle 5. Developing a MapReduce Application............. 129 The Configuration API 130 Combining re esources 131 Variable Expansion 132 Configuring the development environment 132 Managing Configuration 132 GenericOptionsParser, Tool, and ToolRunner 135 Writing a unit test 138 apper 138 Reducer 140 Running locally on Test Data 141 Running a job in a local Job runner 141 Testing the Driver 145 Running on a Cluster 146 ging 146 Launching a Job 146 The MapReduce Web UI 148 Retrieving the results 151 Debugging a Job 153 Using a Remote debugger 158 g a Jo Profiling Tasks 160 MapReduce Workflows 163 Decomposing a Problem into MapReduce Jobs 163 Running dependent jobs 165 6. How MapReduce Works 167 Anatomy of a MapReduce Job run 167 Job Submission 167 Job Initialization 169 Task assignment 169 Task execution 170 Progress and Status Updates 170 Job Completion 172 Failures 173 Task failure 173 Tasktracker failure 175 obtracker上 allure 175 Job Scheduling 175 The Fair Schedul 176 The Capacity Scheduler 177 Table of contents|ⅶi Shuffle and sort 177 The Map Side 177 The Reduce Side 179 Configuration Tuning 180 Task execution 183 Speculative Execution 183 Task jVm Reuse 184 Skipping Bad records 185 The task execution environment 186 7. MapReduce Types and Formats ,189 MapReduce types 189 The Default Map Reduce Job Input Formats 198 nput Splits and Records 198 Text Input 209 Bi Input 213 Multiple inputs 214 Database Input(and Output) 215 Output Formats 215 Text Output 216 Binary Output 216 Multiple outputs 217 Lazy Output 224 Database Output 224 8. MapReduce Features......................... 225 Counters 225 Built-in Counters 225 User-Defined Java Counters 227 User-Defined Streaming Counters 232 Sorting 232 Preparation 232 Partial sort 233 Total Sort 237 ry so 241 Joins 247 ap-SIde Joins 247 Reduce-Side joins 249 Side data distribution 252 Using the Job Configuration 252 Distributed cache 253 MapReduce library classes 257 ⅶ ii Table of Contents

187.86MB
hadoop权威指南第4版(中文)
2019-01-25这是hadoop权威指南的第4版,是中文的,想要学习大数据有关hadoop的同学可以下载
15.78MB
hadoop权威指南第三版和配套源码
2014-10-21hadoop权威指南第三版和配套源码,赶紧下吧!第三版,比第二版多了部分内容
4.28MB
Hadoop应用开发技术详解pdf
2014-04-18大数据时代了你还不知道hadoop?知道了还没试试?来了解一下,这是潮流的东西哦
40.35MB
Hadoop权威指南 中文版
2011-09-13本书从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hado叩这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题包括:haddoop简介:mapreduce简介
982KB
《hadoop权威指南》第二章的气象数据文件
2013-11-11为方便大家开发研究用,特上传《hadoop权威指南》第二章的气象数据文件
43.33MB
hadoop入门书籍
2014-06-07hadoop的入门书籍,本人认为一共有以下五本书比较好: 1.云计算资料大全(了解云计算者必读).pdf 2.Hadoop开发者入门专刊 3.Hadoop权威指南%28第2版%29中文版 4.hado
163.86MB
Hadoop权威指南PDF版
2019-04-03完整的Hadoop权威指南,可供广大爱好大数据者学习使用。
183.93MB
Hadoop权威指南.第4版.pdf
2018-08-22Hadoop权威指南.第4版.pdf
52.21MB
【免费】Hadoop权威指南(第3版) 修订版(带目录书签) 中文高清晰PDF
2017-08-17新版已上市!全面深度解读Hadoop的指南,驰骋于云计算和大数据领域的通俗读本
40.70MB
Hadoop权威指南(中文版)
2019-03-09Hadoop的学习,是Java工程师通向大数据的阶梯石,学习和掌握Hadoop技术变得至关重要,《Hadoop权威指南》是Hadoop领域权威书籍!你值得一看!
138B
Hadoop权威指南(中文版)(带书签)与实战网盘链接
2018-08-09Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它
26.81MB
Hadoop权威指南(中文版)
2019-03-02Hadoop编程书籍,由浅入深,介绍Hadoop编程,特别适合初学者以及企业开发人员以及大学生以及其他深造学习者
41.19MB
Hadoop权威指南(中文版)(带书签).pdf
2018-01-27关于hadoop及其生态体系的一本很好的书,内容详实,翻译得应该也比较准确,本人受益很多
187.79MB
Hadoop权威指南_第四版_中文版.pdf
2018-12-27Hadoop权威指南_第四版_中文版.pdf 很好的hadoop学习入门数据和工具书
184.71MB
Hadoop权威指南.大数据的存储与分析.第4版(中文,带书签).pdf
2018-04-18Hadoop权威指南.大数据的存储与分析.第4版(中文,带书签).pdf,Tom White著,王海等翻译,清华大学出版社
108.80MB
hadoop权威指南最新版 pdf
2018-04-09本书通过丰富的案例学习来解释Hadoop的幕后机制,讲述了Hadoop如何解决实际问题。该书涵盖了Hadoop的最新动态,包括MapReduce API.....
4.84MB
Hadoop权威指南(英文原版)
2018-04-08Hadoop权威指南(英文原版)Hadoop权威指南(英文原版)Hadoop权威指南(英文原版)
52.21MB
Hadoop 3.x高清版权威指南(第三版)中文
2018-05-25Hadoop3.x高清版权威指南(第三版)中文,是一本hadoop工程师和大数据工程师必备的书籍。
34.62MB
Hadoop YARN2权威指南(高清完整目录)
2018-06-20Hadoop YARN2权威指南(高清完整目录),完整+高清+带书签书签。希望对大家有帮助
192.30MB
Hadoop权威指南 大数据的存储与分析-第4版-修订版-升级版.pdf
2019-07-24Hadoop权威指南 大数据的存储与分析 第四版
40.34MB
Hadoop权威指南中文版.pdf
2018-11-30Hadoop权威指南中文版.pdf
7.17MB
Hadoop权威指南(第三版)英文版.pdf
2018-11-07Hadoop权威指南(第三版)英文版。 这个是原始的带完整目录书签的高清pdf版本,内容可以复制的哦。
5.18MB
Hadoop权威指南的kindle版本,可调整字体大小
2018-04-09Hadoop权威指南的kindle版本 mobi格式,比pdf格式的优势就是字体可调整大小。也可以在手机上使用MOBIReader阅读!
184.71MB
Hadoop权威指南.第4版.大数据的存储与分析(中文版)
2018-10-18本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。
58.34MB
Hadoop权威指南_大数据.pdf文档
2018-04-16Hadoop权威指南Hadoop权威指南Hadoop权威指南Hadoop权威指南
187.94MB
Hadoop权威指南_第四版_中文版(修订升级高清扫描版)
2018-05-02最新hadoop第4版中文版(高清扫描版),非第3版滥竽充数版,低积分下载福利大家。
8.34MB
Hadoop权威指南(第四版)英文版-带书签
2019-04-10Hadoop权威指南(第四版)英文版,高清,并带书签,方便大家阅读
138.74MB
Hadoop权威指南第三版 中文pdf
2018-03-081.Hadoop权威指南第三版,中文pdf影印版, 2.内附详细标签目录,可供大家检索使用,
187.79MB
hadoop权威指南 带目录 高清版PDF
2019-03-29hadoop权威指南 高清版PDF 学习hadoop必不可少的工具书
188.37MB
Hadoop权威指南第四版中文版 pdf
2018-06-24hadoop权威指南第四版中文版、中文版以及配套的代码,内容以Hadoop2.x为主,包含一些hadoop的stable版本的新特性,与以前版本比较增加了介绍YARN , Parquet , Flum
-
下载
Java.Web整合开发王者归来.zip
Java.Web整合开发王者归来.zip
-
学院
备战2021软考网络规划设计师顺利通关培训套餐
备战2021软考网络规划设计师顺利通关培训套餐
-
博客
Hive安装常见问题
Hive安装常见问题
-
下载
gostudy_zip dos下怎么样才能下go棋
gostudy_zip dos下怎么样才能下go棋
-
下载
java 扫雷源代码 带有详细的注释
java 扫雷源代码 带有详细的注释
-
下载
2020美赛D题附件中的数据
2020美赛D题附件中的数据
-
学院
Redis数据库入门与使用
Redis数据库入门与使用
-
学院
23种JAVA设计模式
23种JAVA设计模式
-
学院
uni-app实战专题
uni-app实战专题
-
博客
JAVA学习笔记之多线程(1)--- 线程的三种打开方式
JAVA学习笔记之多线程(1)--- 线程的三种打开方式
-
学院
备战2021年软考信息系统项目管理师考试学习套餐
备战2021年软考信息系统项目管理师考试学习套餐
-
博客
LeetCode43.46.53题解
LeetCode43.46.53题解
-
博客
数据库笔记整理(一)
数据库笔记整理(一)
-
博客
Python要点
Python要点
-
博客
PTA Data Structures and Algorithms (English) 6-12
PTA Data Structures and Algorithms (English) 6-12
-
学院
前端性能优化
前端性能优化
-
学院
python数据分析基础
python数据分析基础
-
下载
一个很不错的visual c++ vc内存池的源码,本人在项目中使用.很有价值.zip
一个很不错的visual c++ vc内存池的源码,本人在项目中使用.很有价值.zip
-
下载
grbl 源代码 配置部分翻译中文
grbl 源代码 配置部分翻译中文
-
下载
"万年历" C语言 新手
"万年历" C语言 新手
-
博客
duilib(Troy)------输入框实例
duilib(Troy)------输入框实例
-
下载
linux下 如何安装开源软件 手把手教你源代码安装方式.zip
linux下 如何安装开源软件 手把手教你源代码安装方式.zip
-
下载
第四章-BI可视化平台-Superset.pdf
第四章-BI可视化平台-Superset.pdf
-
学院
hadoop自动化运维工具Ambari应用实践
hadoop自动化运维工具Ambari应用实践
-
下载
ucosii+STM32 BLDC电机控制器设计.zip
ucosii+STM32 BLDC电机控制器设计.zip
-
下载
Linux如何察看一个进程内存的信息.zip
Linux如何察看一个进程内存的信息.zip
-
博客
Mybatis 映射文件(映射文件概述)
Mybatis 映射文件(映射文件概述)
-
博客
服务器配置记录
服务器配置记录
-
博客
Shell脚本
Shell脚本
-
博客
pip安装tensorflow
pip安装tensorflow