什么是Hadoop?Google为自己的业务需要提出了编程模型MapReduce和分布式文件系统GoogleFileSystem,并发布了相关论文(可在GoogleResearch的网站上获得:GFS、MapReduce)。DougCutting和MikeCafarella在开发搜索引擎Nutch时对这两篇论文做了自己的实现,即同名的MapReduce和HDFS,合起来就是Hadoop。MapReduce的Dataflow如下图,原始数据经过mapper处理,再进行partition和sort,到达reducer,输出最后结果。图片来自Hadoop:TheDefinitiveGuideHado
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~