Hive 简介 -Hive 的历史由来
Hadoop 和 Hive 组建成为 Facebook 数据仓库的发展
史
随着数据量增加某些查询需要几个小时甚至几天才能完成。
当数据达到 1T 时, MySql 进程跨掉。
可以支撑几个 T 的数据,但每天收集用户点击流数据(每
天约 400G )时 ,Oracle 开始撑不住。
有效解决了大规模数据的存储与统计分析的问题,但是
MapReduce 程序对于普通分析人员的使用过于复杂和繁
琐。
对外提供了类似于 SQL 语法的 HQL 语句数据接口,自动
将 HQL 语句编译转化为 MR 作业后在 Hadoop 上执行。降
低了分析人员使用 Hadoop 进行数据分析的难度。