Google云数据库介绍
谷歌云数据库是一个专门为大型、半结构化数据设计的分布式存储系统。这个系统主要由Google的BigTable构成,它被广泛应用于Google的多个项目,如Google Print、My Search History、Orkut、爬虫与索引管道以及Google Maps/Google Earth等。 BigTable的设计动机主要源于Google面临的大量(半)结构化数据需求,例如URLs的内容、爬取元数据、链接、锚点、PageRank等,以及用户数据、地理位置信息等。这些数据量巨大,达到数十亿的URL和数百TB的卫星图像数据,对传统商业数据库来说,无论是规模还是成本,都是难以承受的。因此,Google选择内部构建自己的数据库系统,以实现低增量成本下的多项目应用,并通过底层存储优化来显著提升性能。 BigTable的目标是实现异步处理的持续更新,确保随时可以访问到最新数据。它需要支持极高的读写速率(每秒数百万次操作)、高效的数据扫描以及大规模一对一和一对多数据集的高效连接。此外,系统还需要能够追踪数据随时间的变化,例如网页在多次爬取中的内容变化。 BigTable是一个分布式多级映射系统,拥有独特数据模型,具备容错性和持久性。它可扩展至数千台服务器,内存数据达到TB级别,磁盘存储数据达到PB级别,能实现每秒数百万次的读写操作,以及高效的数据扫描。BigTable系统是自我管理的,服务器可以动态添加或移除,以适应负载不平衡的情况。 BigTable自2004年初开始设计和初步实施,至今已经成为Google内部许多项目的生产使用或活跃开发工具。这一系统不仅满足了Google对于大数据处理的需求,也展示了在构建大规模分布式系统方面的技术实力和创新精神。通过使用BigTable,Google能够有效地管理和利用其庞大的数据资源,为用户提供高效、实时的服务。
剩余33页未读,继续阅读
- 粉丝: 0
- 资源: 1
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助