2.1.2 Hadoop 发展简史
•
Hadoop 最初是由 Apache Lucene 项目的创始人 Doug Cutting 开
发的文本搜索库。 Hadoop 源自始于 2002 年的 Apache Nutch 项目
——一个开源的网络搜索引擎并且也是 Lucene 项目的一部分
•
在 2004 年, Nutch 项目也模仿 GFS 开发了自己的分布式文件系
统 NDFS ( Nutch Distributed File System ),也就是 HDFS 的前
身
•
2004 年,谷歌公司又发表了另一篇具有深远影响的论文,阐述了
MapReduce 分布式编程思想
•
2005 年, Nutch 开源实现了谷歌的 MapReduce
Hadoop 的标志
评论0
最新资源