GBase 8a MPP 是一种新型关系数据库设计和实践,它基于 MPP 架构和列式存储设计,解决了传统关系数据库的扩展性和大规模并行计算问题,实现了大数据平台的可靠性。 知识点1: 关系数据库的发展历史 关系数据库是 20 世纪 70 年代基于关系代数理论发展的数据管理技术。它将数据以表为单位组织,每个表的数据表现为一个实体,并通过基于范式的数据组织和关联运算使用 SQL 语言实现对数据的动态关系生成。 知识点2: 传统关系数据库的局限性 传统关系数据库基于集中存储和集中计算的计算模式,存在以下问题: 1. 集中存储的限制导致“小机+存储阵列”模式无法承载大量数据的存储和处理,并且造成 I/O 成为瓶颈。 2. 关系数据库基于 AVL 树的索引机制,虽然可以保证按照最小路径寻找数据,但当数据量增长后,索引结构的维护代价将随着数据量的增加越来越大,导致大数据应用下的数据批量写入自身就成为难以解决的问题。 3. 随着数据量增加,更多的数据无法保证维持在内存中,I/O 的瓶颈效应将进一步显著化。 4. 传统数据库管理系统提供基于日志的恢复机制,关 系数据库事务中的数据更新需要首先记录到日志中,而日志需要按照预先定义的策略更新到磁盘上,这个无疑会降低数据处理的性能。 5. 单一 SMP 服务器下的处理能力已经达到极限,对于海量数据条件下的关联运算和聚集运算所需要的计算能力难以满足。 知识点3: 新型关系数据库设计 GBase 8a MPP 是一种新型关系数据库设计,它基于 MPP 架构和列式存储设计,解决了传统关系数据库的扩展性和大规模并行计算问题。它采用了 ScaleOut 的横向扩展性技术,并在存储结构上引入了列式存储和 I/O 读取时的智能过滤技术。 知识点4: NoSQL 和 NewSQL 技术 NoSQL 和 NewSQL 技术是为了解决传统关系数据库问题而发展的新型技术,它们均采用了以 ScaleOut 为代表的横向扩展性技术,并在存储结构上引入了列式存储和 I/O 读取时的智能过滤技术。在事务控制技术上,NoSQL 和 NewSQL 技术都采取了一系列的弱化或简化措施, 使得海量数据的处理一致性保障机制获得一定简化。
- 粉丝: 1602
- 资源: 4236
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助