没有合适的资源?快使用搜索试试~ 我知道了~
Hadoop是一个由Apache基金会所开发的分布式系统基础架构 Hadoop的理论基础,来自于谷歌的三大论文MapReduce、GFS和BigTable,同时也被称为谷歌的三驾马车。
资源详情
资源评论
资源推荐
使用 HADOOP 进行非结构化
数据的中文词频统计
夏光
Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构。
Hadoop 的源头是 Apache Nutch ,该项目始于 2002 年,是 Apache
Lucene 的子项目之一。 2004 年, Google 在“操作系统设计与实
现”( Operating System Design and Implementation , OSDI )
会议上公开发表了题为 MapReduce: Simplified Data Processing
on Large Clusters (《 MapReduce: 简化大规模集群上的数据处
理》)的论文之后,受到启发的 Doug Cutting 等人开始尝试实现
MapReduce 计算框架,并将它与 NDFS ( Nutch Distributed File
System )结合,用以支持 Nutch 引擎的主要算法。由于 NDFS 和
MapReduce 在 Nutch 引擎中有着良好的应用,所以它们于 2006 年 2 月
被分离出来,成为一套完整而独立的软件,并命名为 Hadoop 。到了 2008
年年初, Hadoop 已成为 Apache 的顶级项目,包含众多子项目。
Hadoop 目前最新稳定版本 2.8.0 , 3.0.0-alpha2 。
Hadoop 简述
Hadoop 的理论基础,来自于谷歌的三大论文 MapReduce 、 GFS 和 BigTable ,同时也被
称为谷歌的三驾马车。
MapReduce :
http://blog.csdn.net/active1001/archive/2007/07/02/1675920.aspx
GFS:
http://blog.csdn.net/xuleicsu/archive/2005/11/10/526386.aspx
BigTale:
http://blog.csdn.net/accesine960/archive/2006/02/09/595628.aspx
创建者 Doug Cutting ,他是 Lucene 、 Nutch 、 Hadoop 等项目的发
起人。
剩余19页未读,继续阅读
baidongd
- 粉丝: 4
- 资源: 13
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0