Raft一致性算法论文_raft算法资源-CSDN文库

毕业设计

需积分: 1 77 浏览量 2024-05-14 11:23:24 上传评论收藏 1.26MB PDF 举报

资源推荐

资源详情

资源评论

本篇博客为著名的 RAFT 一致性算法论文的中文翻译，论文名为《 In search of an

Understandable Consensus Algorithm (Extended Version)》(寻找一种易于理解的一致性算法)。

Raft 是一种用来管理日志复制的一致性算法。它和 Paxos 的性能和功能是一样的，但是它

和 Paxos 的结构不一样；这使得 Raft 更容易理解并且更易于建立实际的系统。为了提高理

解性，Raft 将一致性算法分为了几个部分，例如领导选取（leader selection），日志复制

（log replication）和安全性（safety），同时它使用了更强的一致性来减少了必须需要考虑

的状态。从用户学习的结果来看，Raft 比 Paxos 更容易学会。Raft 还包括了一种新的机制

来使得动态改变集群成员，它使用重叠大多数（overlapping majorities）来保证安全。

1. 引言

一致性算法允许一组机器像一个整体一样工作，即使其中的一些机器出了错误也能正常工

作。正因为此，他们扮演着建立大规模可靠的软件系统的关键角色。在过去的十年中

Paxos 一直都主导着有关一致性算法的讨论：大多数一致性算法的实现都基于它或者受它

影响，并且 Paxos 也成为了教学生关于一致性知识的主要工具。

不幸的是，尽管在降低它的复杂性方面做了许多努力，Paxos 依旧很难理解。并且，Paxos

需要经过复杂的修改才能应用于实际中。这些导致了系统构构建者和学生都十分头疼。

在被 Paxos 折磨之后，我们开始寻找一种在系统构建和教学上更好的新的一致性算法。我

们的首要目标是让它易于理解：我们能不能定义一种面向实际系统的一致性算法并且比

Paxos 更容易学习呢？并且，我们希望这种算法能凭直觉就能明白，这对于一个系统构建

者来说是十分必要的。对于一个算法，不仅仅是让它工作起来很重要，知道它是如何工作

的更重要。

我们工作的结果是一种新的一致性算法，叫做 Raft。在设计 Raft 的过程中我们应用了许多

专门的技巧来提升理解性，包括算法分解（分为领导选取（leader selection），日志复制

（log replication）和安全性（safety））和减少状态（state space reduction）（相对于

Paxos，Raft 减少了非确定性的程度和服务器互相不一致的方式）。在两所学校的 43 个学

生的研究中发现，Raft 比 Paxos 要更容易理解：在学习了两种算法之后，其中的 33 个学生

回答 Raft 的问题要比回答 Paxos 的问题要好。

Raft 算法和现在一些已经有的算法在一些地方很相似（主要是 Oki 和 Liskov 的 Viewstamped

Replication。但是 Raft 有几个新的特性：

强领导者（Strong Leader）：Raft 使用一种比其他算法更强的领导形式。例如，日志条

目只从领导者发送向其他服务器。这样就简化了对日志复制的管理，使得 Raft 更易于理解。

领导选取（Leader Selection）：Raft 使用随机定时器来选取领导者。这种方式仅仅是

在所有算法都需要实现的心跳机制上增加了一点变化，它使得在解决冲突时更简单和快速。

成员变化（Membership Change）：Raft 为了调整集群中成员关系使用了新的联合一致

性（joint consensus）的方法，这种方法中大多数不同配置的机器在转换关系的时候会交迭

（overlap）。这使得在配置改变的时候，集群能够继续操作。

我们认为，Raft 在教学方面和实际实现方面比 Paxos 和其他算法更出众。它比其他算法更

端的命令并且把命令加入到它的日志中。它和其他服务器上的一致性模块进行通信来确保

每一个日志最终包含相同序列的请求，即使有一些服务器宕机了。一旦这些命令被正确的

复制了，每一个服务器的状态机都会按同样的顺序去执行它们，然后将结果返回给客户端。

最终，这些服务器看起来就像一台可靠的状态机。

应用于实际系统的一致性算法一般有以下特性：

确保安全性（从来不会返回一个错误的结果），即使在所有的非拜占庭（ Non-

Byzantine）情况下，包括网络延迟、分区、丢包、冗余和乱序的情况下。

高可用性，只要集群中的大部分机器都能运行，可以互相通信并且可以和客户端通信，

这个集群就可用。因此，一般来说，一个拥有 5 台机器的集群可以容忍其中的 2 台的失败

（fail）。服务器停止工作了我们就认为它失败（fail）了，没准一会当它们拥有稳定的存储

时就能从中恢复过来，重新加入到集群中。

不依赖时序保证一致性，时钟错误和极端情况下的消息延迟在最坏的情况下才会引起

可用性问题。

通常情况下，一条命令能够尽可能快的在大多数节点对一轮远程调用作出相应时完成，

一少部分慢的机器不会影响系统的整体性能。

3. Paxos 算法的不足

在过去的 10 年中，Leslie Lamport 的 Paxos 算法几乎已经成为了一致性算法的代名词：它是

授课中最常见的算法，同时也是许多一致性算法实现的起点。Paxos 首先定义了一个能够

达成单一决策一致的协议，例如一个单一复制日志条目（single replicated log entry）。我们

把这个子集叫做单一决策 Paxos（single-decree Paxos）。之后 Paxos 通过组合多个这种协议

来完成一系列的决策，例如一个日志（ multi-Paxos）。Paxos 确保安全性和活跃性

（liveness），并且它支持集群成员的变更。它的正确性已经被证明，通常情况下也很高效。

不幸的是，Paxos 有两个致命的缺点。第一个是 Paxos 太难以理解。它的完整的解释晦涩难

懂；很少有人能完全理解，只有少数人成功的读懂了它。并且大家做了许多努力来用一些

简单的术语来描述它。尽管这些解释都关注于单一决策子集问题，但仍具有挑战性。在

NSDI 2012 会议上的一次非正式调查显示，我们发现大家对 Paxos 都感到不满意，其中甚至

包括一些有经验的研究员。我们自己也曾深陷其中，我们在读过几篇简化它的文章并且设

计了我们自己的算法之后才完全理解了 Paxos，而整个过程花费了将近一年的时间。

我们假定 Paxos 的晦涩来源于它将单决策子集作为它的基础。单决策（Single-decree）

Paxos 是晦涩且微妙的：它被划分为两个没有简单直观解释的阶段，并且难以独立理解。

正因为如此，它不能很直观的让我们知道为什么单一决策协议能够工作。为多决策 Paxos

设计的规则又添加了额外的复杂性和精巧性。我们相信多决策问题能够分解为其它更直观

的方式。

Paxos 的第二个缺点是它难以在实际环境中实现。其中一个原因是，对于多决策 Paxos

（multi-Paxos），大家还没有一个一致同意的算法。Lamport 的描述大部分都是有关于单

决策 Paxos （single-decree Paxos）；他仅仅描述了实现多决策的可能的方法，缺少许多细

节。有许多实现 Paxos 和优化 Paxos 的尝试，但是他们都和 Lamport 的描述有些出入。例如，

Chubby 实现的是一个类似 Paxos 的算法，但是在许多情况下的细节没有公开。

另外，Paxos 的结构也是不容易在一个实际系统中进行实现的，这是单决策问题分解带来

的又一个问题。例如，从许多日志条目中选出条目然后把它们融合到一个序列化的日志中

并没有带来什么好处，它仅仅增加了复杂性。围绕着日志来设计一个系统是更简单、更高

效的：新日志按照严格的顺序添加到日志中去。另一个问题是，Paxos 使用对等的点对点

的实现作为它的核心（尽管它最终提出了一种弱领导者的形式来优化性能）。这种方法在

只有一个决策被制定的情况下才显得有效，但是很少有现实中的系统使用它。如果要做许

多的决策，选择一个领导人，由领带人来协调是更简单有效的方法。

因此，在实际的系统应用中和 Paxos 算法都相差很大。所有开始于 Paxos 的实现都会遇到

很多问题，然后由此衍生出了许多与 Paxos 有很大不同的架构。这是既费时又容易出错的，

并且理解 Paxos 的难度又非常大。Paxos 算法在它正确性的理论证明上是很好的，但是在实

现上的价值就远远不足了。来自 Chubby 的实现的一条评论就能够说明：

Paxos 算法的描述与实际实现之间存在巨大的鸿沟…最终的系统往往建立在一个没有被

证明的算法之上。

正因为存在这些问题，我们认为 Paxos 不仅对于系统的构建者来说不友好，同时也不利于

教学。鉴于一致性算法对于大规模软件系统的重要性，我们决定试着来设计一种另外的比

Paxos 更好的一致性算法。Raft 就是这样的一个算法。

4. 易于理解的设计

设计 Raft 的目标有如下几个：

它必须提供一个完整的、实际的基础来进行系统构建，为的是减少开发者的工作；

它必须在所有情况下都能保证安全可用；

它对于常规操作必须高效；

最重要的目标是：易于理解，它必须使得大多数人能够很容易的理解；

另外，它必须能让开发者有一个直观的认识，这样才能使系统构建者们去对它进行扩

展。

在设计 Raft 的过程中，我们不得不在许多种方法中做出选择。当面临这种情况时，我们通

常会权衡可理解性：每种方法的可理解性是如何的？（例如，它的状态空间有多复杂？它

是不是有很细微的含义？）它的可读性如何？读者能不能轻易地理解这个方法和它的含义？

我们意识到对这种可理解性的分析具有高度的主观性；尽管如此，我们使用了两种适用的

方式。第一种是众所周知的问题分解：我们尽可能将问题分解成为若干个可解决的、可被

理解的小问题。例如，在 Raft 中，我们把问题分解成为了领导选取（leader election）、日

志复制（log replication）、安全（safety）和成员变化（membership changes）。

我们采用的第二个方法是通过减少需要考虑的状态的数量将状态空间简化，这能够使得整

个系统更加一致并且尽可能消除不确定性。特别地，日志之间不允许出现空洞，并且 Raft

限制了限制了日志不一致的可能性。尽管在大多数情况下，我们都都在试图消除不确定性，

但是有时候有些情况下，不确定性使得算法更易理解。尤其是，随机化方法使得不确定性

剩余34页未读，继续阅读

评论收藏

内容反馈

aa452221915

粉丝: 0
资源: 11

Raft一致性算法论文

Raft 一致性算法论文译文

raft-zh_cn:Raft一致性算法论文的中文翻译

raft算法，英文原版论文

Raft一致性算法中文翻译版(格式同原论文)

raft一致性算法中文版

raft一致性算法英文原版论文

分布式一致性算法的经典论文

Raft论文中文翻译版

详解分布式共识（一致性）算法Raft

分布式事务与一致性算法 Paxos & raft & zab.pdf

etcd 中 raft 算法的使用方法

raft-atc14.pdf

对于Raft的四个修改优化论文

raft_zh.pdf

Raft协议原理详解

一文搞懂Raft算法

QCache:基于Raft 实现的分布式缓存

基于Docker的开源云主机集群管理平台本科毕业论文

34个经典javaweb项目实例.zip

项目源码：基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计

毕业设计 springBoot人力资源管理系统+毕业论文+前后端源代码

基于spring boot的小区物业管理系统源码+论文+答辩ppt

毕业设计：舆情监测系统（SpringBoot+NLP）

计算机毕业设计：Flask股票数据采集分析可视化系统 python+爬虫+金融数据

毕业设计-基于JAVA的springboot超市进销存系统(源代码+论文）

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计 项目源码 毕业设计

基于深度学习的课堂行为识别和考试作弊检测系统的设计与实现（python源码）

基于51单片机的智能电子秤系统设计(含代码仿真及论文)

Python爬取智联招聘网站数据，2023.10.31测试，可跑

最新资源

项目源码：基于Hadoop+Spark招聘推荐可视化系统大数据项目计算机毕业设计

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计项目源码毕业设计