Google的经典论文中文版
Cluster:发表于2003 年,主要介绍Google 的集群架构,对Google 搜索系统的
架构也进行了简单介绍
GFS:发表于2003 年,介绍了Google 分布式文件系统的设计及实现。Hadoop 中
与之对应的是HDFS
MapReduce:发表于2004 年,介绍了分布式的编程模型MapReduce。Hadoop 中
与之对应的是Hadoop MapReduce
BigTable:发表于2006,介绍了建立在GFS 之上的结构化数据存储系统,该系统
也是NoSql 的。Hadoop 中与之对应的是HBase
Chubby:发表于2006 年,分布式锁服务系统,利用了很多现有的思想,尤其是
分布式系统中的很多基础理论。Hadoop 中与之对应的是Zookeeper
Sawzall:发表于2006 年,建立在MapReduce 之上的分布式查询脚本语言。Hadoop
中与之对应的是Pig Hive 等
GFS 访谈录:Kirk McKusick 与Sean Quinlan 之间关于GFS 的起源和演化的访谈内
容。可能比GFS 本身更有意思。
SMAQ:关于海量数据的存储计算及查询的一个综述性文章。将视野从Google 系
列扩展到了当今流行的各种NoSql 系统。