本文来自知乎,由火龙果软件Anna编辑、推荐。在开始了解hive之前,需要了解一些知识或者概念,可以更好的理解hive实现原理GoogleMapReduce是Google基于函数式编程map(映射),reduce(化简)提出的一种分布式编程模型,在模型中隐藏了分布式集群的实现细节,交由框架底层进行实现,能够使程序员在不了解分布式并行编程的情况下,将自己书写的程序在分布式系统上运行Map:将输入的一对键值对转换为一组中间键值对(k1,v1)->list(k2,v2)Reduce:将所有键相同的中间键值对合并,得到关于那个键的结果(k2,list(v2))->(k2,v3)以一个很简单的WordC