大数据技术之HBase资源-CSDN文库

需积分: 9 195 浏览量 2022-07-26 17:44:19 上传评论 1 收藏 2.72MB PDF 举报

资源详情

资源评论

资源推荐

HBASE

第 1 章 NoSQL 简介

1.1 关系型数据库的查询瓶颈

当用户表的数据达到几千万甚至几亿级别的时候，对单条数据的检索将花费数秒甚至达到分钟级别。实际情况

更复杂，查询的操作速度将会受到以下两个因素的影响：

①高并发的更新(插入、修改、删除)操作。大中型网站的并发操作一般能达到几十乃至几百并发，此时单条数

据查询的延时将轻而易举地达到分钟级别。

②多表关联后的复杂查询，以及频繁的 group by 或者 order by 操作，此时，性能下降较为明显。

1.2 CAP 定理

分摊读写压力的有效方式是将单个关系型数据库扩展为分布式数据库。但是，随之而来的问题则是很难保证原

子性。没有了原子性，事务也无从谈起，关系型数据库也就没有了存在的意义。

为了保证原子性，则需要增加很多额外的必要操作，此时一次写操作的性能却面临大幅下降了。

20

世纪

90

年代初期

Berkerly

大学有位

Eric Brewer

教授提出了一个

CAP

理论。全称是

Consistency

Availability and Partition tolerance

。



Consistency

（强一致性）：数据更新操作的一致性，所有数据变动都是同步的。



Availability

（高可用性）：良好的响应性能。



Partition tolerance

（高分区容错性）：可靠性。

Brewer

教授给出的定理是：任何分布式系统只可同时满足二点，没法三者兼顾。

Brewer

教授给出的忠告是：架构师不要将精力浪费在如何设计能满足三者的完美分布式系统，而是应该进行取

舍。所以专家们始终没有办法构建出一个既有完美原子性又兼具高性能的分布式数据库。

剩余35页未读，继续阅读

评论0

内容反馈

浅酌丶流年

粉丝: 0
资源: 6

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip