下载  >  开发技术  >  Java  > Hbase 权威指南(中文)

Hbase 权威指南(中文) 评分:

《HBase权威指南》探讨了如何通过使用与HBase高度集成的Hadoop将HBase的可伸缩性变得简单;把大型数据集分布到相对廉价的商业服务器集群中;使用本地Java客户端,或者通过提供了REST、Avro和Thrift应用编程接口的网关服务器来访问HBase;了解HBase架构的细节,包括存储格式、预写日志、后台进程等;在HBase中集成MapReduce框架;了解如何调节集群、设计模式、拷贝表、导入批量数据和删除节点等。
内容提要 本书探讨了如何通过使用与 HBase高度集成的Hado0p将 HBase的可伸缩性变 得简单;把大型数据集分布到相对廉价的商业服务器集群中;使用本地Java客 户端,或者通过提供了REST、Avro和 Thrift应用编程接口的网关服务器来访 问 HBase;了解 HBase架构的细节,包括存储格式、预写日志、后台进程等; 在 HBase中集成 Mapreduce框架;了解如何调节集群、设计模式、拷贝表、导 入批量数据和删除节点等。 本书适合使用 HBase进行数据库开发的高级数据库研发人员阅读。 O Reilly Media,nc介绍 O'Reil! Media通过图书、杂志、在线服务、调查研究和会议等方式传播创新知识。自1978年 开始, OReilly-一直都是前沿发展的见证者和推动者。超级极客们正在开创着未来,而我们关 注真正重要的技术趋势—通过放大那些“细微的信号”来刺激社会对新科技的应用。作为 技术社区中活跃的参与者, OReilly)的发展充满了对创新的倡导、创造和发扬光大 O'Rely为软件开发人员带来革命性的“动物书”;创建第一个商业网站(GNN);组织了 影响深远的开放源代码峰会,以至于开源软件运动以此命名;创立了Make杂志,从而成为 DIY革命的主要先锋;公司一如既往地通过多种形式缔结信息与人的纽带。 OReilly)的会议和 峰会集聚了众多超级极客和髙瞻远瞩的商业领袖,共同描绘岀开创新产业的革命性思想。作 为技术人士获取信息的选择, OReilly现在还将先锋专家的知识传递给普通的计算机用户。无 论是通过书籍出版,在线服务或者面授课程,每一项 OReilly的产品都反映了公司不可动摇的 理念—信息是激发创新的力量。 业界评论 “ O'Reilly radar博客有口皆碑。 O'Reilly凭借一系列(真布望当初我也想到了)非凡想法建立了数百万美元的业务。” -Business 2.0 O Reilly Conference是聚集关键思想领袖的绝对典范。 CRN 本O' Reilly的书就代表一个有用、有前途、需要学习的主题 — irish times Tim是位特立独行的商人,他不光放眼于最长远、最广阔的视野并且切实地按照 Yogi berra的建议去做了:‘如果你在路上遇到岔路口,走小路(岔路)。’回顾 过去Tim似乎每一次都选择了小路,而且有几次都是一闪即逝的机会,尽管大路也 不错 Linux Journal 感谢我的妻子 Katja,感谢我的女儿 Laura, 以及我的儿子Leon。我爱你们! 推荐序 近年来,新兴的互联网服务领域,以及电信、金融和交通等各传统行业出现了数据资 产的爆炸性增长,这些数据资产的类型以非结构化和半结构化为主,如何低成本且高 效率地存储和处理PB甚至EB量级的数据成为了极大的挑战。 Goge公司提出的 MapReduce编程框架、GFS文件系统和 Big Table存储系统成为了大数 据处理技术的开拓者和领导者,而源于这三项技术的 Apache Hadoop等开源项目则成为了 大数据处理技术的事实标准,迅速推广至国内外各大互联网企业,成为了PB量级大数据 处理的成熟技术和系统。面对不同的应用需求,基于 Hadoop的数据处理工具也应运而生, 例如,Hive、Pg等已能够很奷地解决大规模数据的离线式批量处理问题。但是, Hadoop HDFS适合于存储非结构化数据,且受限于 Hadoop MapReduce编程框架的高延迟数据处 理机制,使得 Hadoop无法满足大规模数据实时处理应用的需求 传统的信息系统和Web应用大多采用LAMP架构构建,并使用关系型数据库存储、组织和 管理结构化或半结构化数据。通用的关系型数据库无法很好地应对在数据规模剧增时导致的 系统扩展性和性能问题。因此,业界出现了一类面向半结构化数据存储和处理的高可扩展、 低写入/査询延迟的系统,例如,键值存储系统、文档存储系统和类 BigTable存储系统等, 这些特性各异的系统也可统称为 NOSQL系统。 Apache HBase就是其中已迈向实用的成熟系 统之一。 HBase之所以能成为迈向实用的成熟系统,一是核心思想来源于 Google的 BigTable, 二是有 Apache及 Hadoop开源社区的支撑,三是有诸如 Facebook、淘宝和支付宝等互联网 公司的应用实践,保证了 HBase系统的稳定性和可用性。目前,作为关系型数据库的有益补 充, HBase已成功应用于互联网服务领域和传统行业的众多在线式数据分析处理系统中。 本书涉及 HBase使用和开发过程中的各方面内容,章节组织由浅入深,内容阐述细致 入微并且贴近实际,可以作为参考书以方便读者在开发过程中随时查阅。本书译者之 刘佳向 HBase开源社区提交过多项错误修复和新功能,参与过多项 HBase有关的大 数据分析系统研发项目,积累了丰富的 HBase系统开发经验。我相信本书对于 HBase 使用者和开发者来说,都是及时和不可或缺的。 查礼 于中科院计算所 2013年7月 译者序 随着历史数据的积累和数据量的高速增长,海量数据领域越来越被重视,且该领域涌 现出了非常多的新技术。技术的发展和时间的沉淀使得 HBase开始被大家广泛认可, 成为海量数据在线存储领域的首选。 本书是讲述 HBase相关技术的第一本图书,也是著名图书出版商 O'Reilly出版发行的 HBase权威书籍 本书从架构、开发、应用和运维等多个角度描述了 HBase,深入介绍了 HBase内核的 原理和机制以及社区的发展方向,并提供了应用层面的多种示例和源代码。本书为每 个用例和知识点提供了丰富的解释和注意要点,使用户可以由浅入深地了解原理并深 度使用其功能,并且体现了在 HBase教学方面的最新进展和最高水平。 本书的成功离不开 Lars George的努力。在 HBase还处于萌芽时期时, Lars George就开 始投入了大量的精力,从修复 HBase中的问题到优化性能,推广 HBase并编写 HBase 可用性文档,他是 HBase领域里大师级的人物。而这本《 HBase权威指南》花费了Lars George许多的时间和精力。 阅读本书后,我们不得不承认这本大师级的著作很好地应对了社区中 HBase发展所面 临的挑战。不得不说的是,本书著作和翻译经历的时间较长,而社区中 HBase发展速 度较快,许多版本已经发行,许多问题也得以修复,因此,本书最终落地后会与最新 HBase版本的功能特性有少许描述性出入,还望广大读者见谅。 在翻译过程中,我们深刻地发现国外技术领域的专业性,深深地被世界级的高水平技 术所震撼。我们由衷地希望本书中文版的出版能够推动国内 HBase教学、使用和发展。 本书译者代志远在翻译期间就职于阿里巴巴,译者刘佳是中科院计算所研究生,现为 普泽天玑技术总监,译者蒋杰在腾讯担任数据与运营支撑平台副总经理。 感谢人民邮电出版社的编辑,他们为保证本书质量付出了大量的努力。 本书中概念和术语较多,许多概念和术语尚无公认的中文译法,加之译者水平有限 译文中若有不妥之处,恳请读者批评指正 代志远 2013年7月 序 HBase的故事开始于2006年,当时旧金山的 Powerset创业公司试图建立一个网页的自 然语言搜索引擎,但他们构建索引时涉及一个复杂的过程,比标准的分词索引结果集 大了两个数量级。他们曾经使用 Amazon Web Service存储索引,但是爬虫抓取过程中 的负荷主要集中在此。(叮铃铃,叮铃铃“您好!这里是AWS,无论你正在运行什么 请停止运行!”)他们恰好在寻求解决方案,而此时 Google的 BigTable论文发表了。 Powerset公司的工程负责人 Chad Walters此时发表了如下的言论: 与 Google基于GFS( Google File System)构建的 Bigtable一样,在 Hadoop 的分布式文件系统(HDFS)基础上构建一个开源系统是一个非常不错的主 意:(1)这套架构是成熟的并且可拓展;(2)我们可以直接利用 Hadoop 的HDFS;(3)我们可以扩大 Hadoop生态系统的影响力 BigTable论文发表后,在社区中,人们一次又一次地讨论基于 Hadoop构建类 Big Table 系统的可行性。在2007年年初, Mike Cafarela出乎意料地在 Hadoop的问题跟踪系统 中上传了一个包含30多个Java文件的tar包:“我实现了一个类 BigTable架构的存储 系统demo,叫做 HBase,虽然它还不完善,但是它已经做好准备让用户进行实验和检 査了。”Mike与 Doug Cutting在 Nutch(一个开源搜索引擎)项目中长期共事,Doug Cutting在 Nutch中实现了一个类似于 Google分布式文件系统的项目来管理磁盘,因此 Nutch中构建的索引存储可以不仅仅存储在一台机器中( Nutch分布式文件系统最后发 展成为了HDFS) Powerset公司的 Jim Kellerman增加了测试用例并填补了其他空白,使得 HBase可以作 为 Hadoop的一部分代码进行提交。 Doug Cutting在2007年4月3日完成了 HBase的 第一次代码提交,代码提交到了 Hadoop工程根目录的conr氿子目录中。 HBase的第 一个版本在2007年10月作为 Hadoop0.150的一部分发布了。 没过多久,本书作者Lars开始在# hbase iro交流频道出现。当时Lars面临大数据的问题, 并且尝试用 HBase来解决这个问题。经过一番辛苦的摸索,Lars成为了 Powerset之外的 HBase的第一个用户。我清楚地记得,Lars当时记录了他在 Worldlingo公司的生产集群 的问题反馈清单,Lars当时在这家公司担任CTO。清单展示了他们的生产集群中HBae 的10个版本(从 Hadoop0.15.1到 HBase0.20),每个版本的集群都有将近40台机器。 在这些年来所有为 HBase做出贡献的人中,具有史诗般意义的就是Lars,因为他写了这 本书。Lars一直在为 HBase贡献文档, HBase想要被更好地使用和推广,就需要有良好 的文档。每个人都同意Lars的想法,并且能够专注地投入编程工作中,因此Lars在工作 和欧洲旅行期间开始编写如何使用 HBase的文档和架构描述,并承担起了 HBase非官方 的欧洲大使职责。Lars在其关于HBase的博客(http://www.larsgeorage.com)中记录了 HBase的工作原理,并在关键阶段推动了 HBase社区的发展(一篇重要的博客文章解释 了Hase依赖Iwy进行编译是个非常棒的主意) 在微软公司赞助 HBase的时期, HBase也发生了非常有趣的事情。 Powerset在2008年 7月被微软收购,在此期间其员工不允许贡献代码,因为微软法务部门需要审核HBae 代码库并查看 HBase与 SQLServer的关系,直到一个月后才宣布重新贡献代码给社区 (我是微软的一名员工,全职为 Apache开源项目工作)。之后 Facebook也开始使用 HBase,用于存储海量的邮件信息或点击信息,后来 Yahoo部署了100台 HBase集群 用于定位微软Bing的爬虫快照同期非运行在HDFS上的MapR系统也仍处在开发中。 我很清楚,社区和 HBase的发展得利于一群 HBase的核心 committer的辛苦努力。 些核心开发成员,如 Todd Lipson、 Gary Helling和 Nicolas Spiegelberg,已经付出了 多年的努力,没有他们我们无法走到今天这一步, HBase目前已经从一个分支代码成长 为了一个独立存储项目。 Jonathan Gray冒险将其初创的 streamy. com网站基于 HBase 进行建设, Andrew Purtell在趋势科技组建了一只 HBase团队, Ryan Rawson得到了 StumbleUpon的赞助,这是 HBase在 Powerset、微软之后获得的最主要的赞助,并且还 发掘了一个非常厉害的 commiter-John-Daniel Cryans,而当时 Cryan还只是一个繁 忙的学生。之后Lars不断地修复缺陷,并撰写文档。因此,Lars是撰写第一本关键的 HBase书籍的最佳人选,也让所有人都可以了解 HBase Michael Stack, HBase项目管理人 序

...展开详情
2014-05-14 上传 大小:43.03MB
举报 收藏 (3)
分享

评论 下载该资源后可以进行评论 共12条

lundunzaina 不错的资源,值得下载!
2016-03-11
回复
cyfgod 有中文版本,很好,学习中。
2015-06-16
回复
wo24031442 很好的资料,多谢分享,好人一生平安!
2015-06-04
回复
lijunxijava 非常好的资料,谢谢
2015-05-25
回复
shengyupian527 非常好的资料,谢谢
2015-05-13
回复
HBase权威指南中文版.pdf

HBase权威指南中文版.pdf 高清带标签版本 HBase权威指南中文版.pdf 高清带标签版本

立即下载
HBase权威指南中文版---高清版.pdf

HBase权威指南中文版---高清版.pdf 个人收集电子书,仅用学习使用,不可用于商业用途,如有版权问题,请联系删除!

立即下载
hbase权威指南

hbase权威指南中文版hbase权威指南中文版hbase权威指南中文版 hbase权威指南中文版hbase权威指南中文版hbase权威指南中文版

立即下载
HBase权威指南中文版(清晰版)

HBase权威指南中文版(清晰版),亲测可用

立即下载
HBase权威指南(中文版)pdf带目录

HBase权威指南(中文版)pdf带目录

立即下载
hbase权威指南英文原版

hbase权威指南英文原版,带有书签目录。

立即下载
hbase权威指南(pdf)

大数据盛行的年代,数据的存储、处理、分析行业越来越热,在hadoop中的hbase是一个以列存储的nosql数据库,对于海量数据的存储、分析具有划时代意义,该文档简单易懂,通过例子让你更轻松掌握hbase!

立即下载
hbase权威指南 配套源码

hbase权威指南 配套源码,自己从官网上下载的,拿来分享下

立即下载
hbase权威指南中文完整版pdf

hbase权威指南中文完整版pdf 12章+6附录

立即下载
HBase权威指南(中文版) PDF

HBase权威指南(中文版) 高清指南,想要的可以看看,~~~

立即下载
HBase权威指南(中文版)

HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。

立即下载
Hbase权威指南中文版 高清完整版PDF

hbase权威指南中文完整版pdf 高清版 完整12章节与6附录

立即下载
Hbase权威指南 随书源代码 源码包 绝对完整版

Hbase权威指南 随书源代码 源码包 绝对完整版 带pom文件,可以直接作为一个完整工程导入eclipse等ide

立即下载
Hbase权威指南高清中文版本.pdf

1、HBase高清权威指南中文版本 2、文档包含目录结构 其他不多说

立即下载
HBase权威指南 带目录 中文版-高清版PDF

辛辛苦苦找的,希望帮助更多的人。开源让技术更进步。您的好评就是对我最大的鼓舞。

立即下载
HBase权威指南

HBase权威指南 HBase权威指南 809页 英文版 完整

立即下载
html+css+js制作的一个动态的新年贺卡

该代码是http://blog.csdn.net/qq_29656961/article/details/78155792博客里面的代码,代码里面有要用到的图片资源和音乐资源。

立即下载
qBittorrent插件集合(22个)

btetree.py cpasbien.py divxtotal.py ilcorsaronero.py kickass.py leetx.py limetorrents.py linuxtracker.py nyaa.py nyaapantsu.py nyaasi.py pantsu.py psychocydd.py rarbg.py rutor.py skytorrents.py sukebei.py sumotorrent.py tntvillage.py torrent9.py torrentfunk.py zooqle.py

立即下载
万能BIOS刷新工具Universal Flash Utility V8.95

近期在网搜刷新工具时,寻得这组万能刷新工具类型的希缺资源[正宗正版工具软件],特上传bios之家论坛,对号最需要它的爱好者群!软件版权归属原作品发布方,提供与本网站各界爱好者试用,以便交流刷新比较困难的 bios 实际使用经验![[ 其中的895工具是在本论坛首次亮像,=本论坛335469299用户曾在2011年6月29日发表过848的使用资料=各位可划文搜链接[ ==http://bbs.bios.net.cn/?8024== ]看 用户 awb 空间 所存载主题=求万能bios刷写工具flash849.exe-=之=-335469299 -=所回帖发布软件介绍使用参数 参考试用万能 bio

立即下载
压缩包爆破解密工具(7z、rar、zip)

压缩包内包含三个工具,分别可以用来爆破解密7z压缩包、rar压缩包和zip压缩包。

立即下载