Hive 是什么
•
Hive 由 Facebook 开发, 2008 年 Facebook 将 Hive 项目贡献给 Apache ,成为开源项目
•
是基于 Hadoop 的一个数据仓库工具
•
可以将结构化的数据映射为一张数据库表
•
并提供 HQL(Hive SQL) 查询功能
•
底层数据是存储在 HDFS 上
•
Hive 的本质是将 SQL 语句转换为 MapReduce 任务运行。大部分的查询、计算由 MapReduce 完成
(包含 * 的查询,比如 select * from tbl 不会生成 MapRedcue 任务)。
•
使不熟悉 MapReduce 的用户很方便地利用 HQL 处理和计算 HDFS 上的结构化的数据,适用于离线的
批量数据计算。