没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
Hive
1.Hive 原理介绍
1.1Hive 介绍
大数据仓库解决方案,基于 平台搭建的数据仓库
英文名称为 ,可简写为 。
面向分析的存储系统(面向数据分析的存储系统)
数据库与数据仓库的区别?
数据库
面向事务性操作
响应及时
数据量不大
数据仓库
面向分析操作
存储历史数据
数据量大
响应不及时
Hive 解决什么问题 Oracle -- 传统数据仓库搭建
在 项目中,HDFS 解决了文件分布式存储的问题,MapReducce 解决了
数据处理分布式计算的问题,Hbase 解决了数据的存储和检索。
但是要对 上的文件或者 上的表进行查询的时候,要手工写一堆的
,这只能由懂 的程序员操作,对于业务人员或数据科学家,
非常不方便。因为他们已经习惯了通过 跟 (关系数据库管理系统)打交
道,因此如果有 查询文件和数据就显得很有必要,这就是 要满足的需求。
是一个 解析引擎,将 语句转译成 ,然后再 平
台上运行,达到快速开发的目的。
本身不存储数据,它完全依赖 和 。
的内容是读多写少,不支持对数据的改写和删除
!解决海量数据分布式存储问题,基于 平台搭建的数据仓库
!表面
!计算 计算引擎 "#$
!资源 %&&&
!存储
1.2Hive 原理
原理详解:'()&)&("*(
+,-./.-012234/5+4/5//4/55
4/5//4/5.64/5//7-//0-+8,77-+98/-507-..74/5//4/5/:
4/5//4/5//4/5.6
4/5///8708+7.)7.878/..0))4/5//4/5+;237-//0-+8,77
-+98/-507-..7;#238;23)22)
&&$(/<<&<=/
+,-./.-0)>2&$2/22&$2/,;234?549?4,
4?+4,849-;37879)///-).887)079+
Hive 的基本工作,简单提炼一下来表述,就是将结构化的数据映射为一张
数据库表,并提供完整的 SQL 查询功能,可以将 SQL 语句转换为
MapReduce 任务进行运行。
1.2.1 分层
7)用户接口
:@ :A&
/)
/提供客户端认证服务
元数据可以部署为 % 或嵌入式数据库
解析器
优化器
执行器
.):
计算 #$
资源 &&
存储 =
/)分析 )B
)BBB'
表存放的 目录地址 C&(
元数据存放的地址 %!!D''
1.2.2 工作原理
7) 接收 语句;
/) 进行词法分析和语法分析;
.) 进行语义分析;
0) 生成逻辑计划,得到算子树;
5) 逻辑计划优化。对算子树进行优化,包括剪枝和谓词下推等;
-) 物理计划生成。将逻辑计划生产出包含由 任务组成的 6E 的物
理计划;
+) 物理计划执行。将 6E 发送到 集群进行执行;
9) 将查询结果返回。
1.2.3 Hive 的用户接口
7) :@( 命令行):客户端可以直接在命令行模式下进行操作。通过命
令行,用户可以定义表、执行查询等。如果没有指定其他服务,这个就是默认
的服务。
/) @( 接口): 提供了更直接的 界面,可以执行查询语
句和其他命令,这样可以不用登陆到集群中的某台机器上使用 :@ 来进行查询。
.) "=(即 ):用于监听来自于其他进程的 "= 连接的一
个守护进程。"= 客户端目前支持 :FF G& 等语言。
1.2.4 Hive 创建表和处理数据的操作
(1)Hive 创建表的过程
第一步:解析用户提交的 语句,进行解析,分解为表、字段、分区等
对象;
第二步:根据解析到的信息构建对应的表、字段、分区等对象。
(2)Hive 元数据的三种存储模式
模式一:单用户模式;
模式二:多用户模式;
模式三:远程服务器模式。
中的数据,分为表数据和元数据。表数据是 表格(")中
具有的数据,而元数据是用来存储表的名字、表的列、表分区及其属性以及
表的数据所在目录等。
1.3 Hive 安装
6H6!H:
官方网站 6 安装
7)下载 二进制包
/)解压
.)配置 @I?2J? 到环境变量
0)6JJG2J? 配置到 &)
5)为 创建 目录
==$
==$C
==(FC
==(FCC
-)BBB
+))&
2.Hive Sql
参考资料:'CCC)&()&0.0-.50)
!!文档
8. 基础应用
操作分类 具体操作 sql 备注
K建表
K删除表
K修改表结构
K创建删除视图
K创建数据库
K显示命令
:6
:"&"
6"G&:&
:6IC
:@&B
:&&
C
K数据插入
L&MN
)))&
&C
K数据查询LN
2.1 DDL
2.1.1 建表说明
元数据'描述数据的数据
表分类:主要分内表和外表
剩余37页未读,继续阅读
资源评论
丶圣杰
- 粉丝: 1
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 农村信用社联合社计算机信息系统投产与变更管理办.docx
- 农村信用社联合社计算机信息系统数据管理办法.docx
- 利用SPSS作临床效度分析线上计算网站介绍-医学研究部统计谘.(医学PPT课件).ppt
- 利用Zabbix监控mysqldump定时备份数据库状态.docx
- 利用计算机解决问题的基本过程.doc
- 化工铁路通信工程总结.doc
- 北京大学网络教育软件工程作业.docx
- 医药公司(连锁店)计算机操作规程未新系统的自行按照旧制修改-新系统过制的编号加修模版.doc
- 医药公司(连锁店)计算机系统操作规程模版.doc
- 医药连锁门店计算机系统的操作和管理程序未新系统的自行按照旧制修改-新系统过制的编号加修模版.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功