没有合适的资源?快使用搜索试试~ 我知道了~
HBase官方指南——数据模型篇
需积分: 10 6 下载量 140 浏览量
2018-09-03
14:07:57
上传
评论
收藏 883KB PDF 举报
温馨提示
试读
17页
HBase官方指南——数据模型篇
资源推荐
资源详情
资源评论
Apache Hbase 最新官网指南中文翻译 数据模型篇
1
Apache HBase 参考手册(3)
数据模型篇
Version 2.0.0-SNAPSHOT
Apache Hbase 最新官网指南中文翻译 数据模型篇
2
目录
数据模型(Data Model) ................................................................................................................ 3
19.概念视图(Conceptual view) ........................................................................................... 4
20.物理视图(Physical View) ................................................................................................ 6
21.命名空间(Namespace) ................................................................................................... 7
21.1 命名空间管理(Namespace management) ........................................................ 7
21.2. 预定义命名空间(Predefined namespaces) ...................................................... 7
22.表(Table) ......................................................................................................................... 8
23.行(Row)........................................................................................................................... 8
24.列簇(Column Family) ...................................................................................................... 8
25.Cells ...................................................................................................................................... 9
26.数据模型操作(Data Model Operations) ........................................................................ 9
26.1 Get ............................................................................................................................. 9
26.2 Put ............................................................................................................................. 9
26.3 Scans.......................................................................................................................... 9
26.4 Delete ...................................................................................................................... 10
27.版本(Versions) .............................................................................................................. 10
27.1 指定存储版本数量 ................................................................................................ 11
27.2 版本和 HBase 操作............................................................................................... 11
27.2.1 Get/Scan ....................................................................................................... 12
27.2.2 默认 get 操作实例(Default Get Example).............................................. 12
27.2.3.检索指定版本(Versioned Get Example) ................................................ 12
27.2.4. Put ............................................................................................................... 13
默认版本设置(Implicit Version Example) ............................................. 13
指定版本设置(Explicit Version Example) ............................................. 13
27.2.5. Delete .......................................................................................................... 14
27.3. 当前的限制(Current Limitations) .................................................................... 15
27.3.1. Deletes mask Puts ....................................................................................... 15
27.3.2. Major compactions 改变了检索结果(Major compactions change query
results) .................................................................................................................. 15
28. 排序(Sort Order) ......................................................................................................... 16
29. 列-元数据(Column Metadata) ................................................................................... 16
30. 连接(Joins) .................................................................................................................. 16
31. ACID ................................................................................................................................... 17
Apache Hbase 最新官网指南中文翻译 数据模型篇
3
数据模型(Data Model)
Hbase 采用行列表来存储数据。这是在关系型数据库里面的说法,但这种描
述并不确切,这可以帮助理解 HBase 表的多维映射。
Table
一个 HBase 的表由很多行构成。
Row
行由 row key 及一个或多个列及列值构成。行按 row key 的字母序存储。所
以 row key 的设计是非常重要的。我们的设计目标是将关联的行相邻存储。常见
的行键模式是一个网站域名。如果你将域名作为 row key,你应该会将他们倒序
存储(如:org.apache.www, org.apache.mail, org.apache.jira)。这样的话,所
有的 apache 的站点将相邻存储,而不是像基于正序那样基于第一个单词发散存
储。
Column
HBase 中的列包含 Column Family 和 Column 定义,他们之间用“:”隔开。
Column Family
我们经常处于性能考虑,将一组列和他们的值物理上将他们集合在一起集合体我们称之
为 Column Family。每个 column Family 都有单独的存储配置,比如说他们的值是否需要缓存
到内存中,数据是否需要压缩,row key 是否需要编码等等。表中的每一行都拥有相同的
Column Family,尽管有可能有些行 Column Family 是空的。
Column Qualifier
Column Family 之上的列定义是为一个给定的数据提供索引。对于一个指定
的 Column Family:content,它的可能的列定义是 content:html,content:pdf 等等。
尽管 Column Family 是在表建立时就已经创建,但列定义是可变的,每一行的列
定义可能都有很大的不同。
Cell
Cell 是 row,column family,列定义,值和标志值版本的 timestamp 的组合。
Timestamp
Timestamp 是每个值写入时同时记录的一个时间值,用来标记每一个值得版
Apache Hbase 最新官网指南中文翻译 数据模型篇
4
本。默认情况下 timestamp 标记的是写入数据时 regionserver 的时间,但你也可
以在 put 数据到 cell 时指定不同的时间。
19.概念视图(Conceptual view)
你可以参考 Jim R. Wilson 发表的博客 Understanding HBase and BigTable 更好
的理解。另外一个更好的解释是 Amandeep Khurana 的 PDF 格式的 Introduction to
Basic Schema Design。
这可以帮助你从不同的角度去深刻理解 HBase 的设计模式。这两篇文章覆盖
了下面章节中的内容。
下面的例子是在 BigTable 论文第二页的例子基础之上做了少许修改的。这里
有一个包括两行(com.cnn.www 和 com.example.www)的表 webtable,包括了
三个 column family 名字分别是 contents, anchor 和 people。本例中,第一行
(com.cnn.www), anchor 包含两列(anchor:cssnsi.com, anchor:my.look.ca),
contents 包含一列(contents:html)。 这个例子中 com.cnn.www 行包括 5 个版本
的数据,com.example.www 包括 1 个版本的数据。contents:html 列包含了给定站
点的所有 html 数据。anchor column family 定义的是每一个连接到这一行所代表
的网站的外部链接站点,包括他们的链接上的文本内容。people column family
代表的是与站点关联的人的信息。
注:
Column names
按约定,一个
column name
由
column family
名字作为前缀并加上限定词(即定义的名
字)构成。比如,列定义
content
:
html
为在
content
的
column family
下定义名为
html
的
列。“
:
”作为分隔符。
Table 4. Table webtable
剩余16页未读,继续阅读
资源评论
yorkof518
- 粉丝: 0
- 资源: 8
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- libjpeg 编译所需的 Win32.mak vs编译libjpeg
- 自动驾驶-状态估计和定位-粒子滤波实现和源码.pdf
- 数据可视化-智慧物流服务中心大屏页面.zip
- yolov5,SSD 可能使用到的一些代码
- bbbbbbbbbbbbbbbbbb
- 安卓逆向学习笔记之Frida Stalker 还原OLLVM AES.docx
- 安卓逆向学习笔记之unicorn来trace还原OLLVM Base64.docx
- 基于jquery的自定义表格组件实现
- Nessus最新20240426离线安装插件all-2.0.tar.gz
- 最新版本私钥助记词碰撞器大富豪使用python进行制作通过接口的方式进行验证支持多币种多链多网络一分钟万次验证高出货率
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功