Kafka详解及常见面试问题解析（值得珍藏）_@KafkaListener资源-CSDN文库

需积分: 5 79 浏览量 2024-01-17 00:06:24 上传评论收藏 2.2MB PDF 举报

资源推荐

资源详情

资源评论

1. 定义

Kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。它是一种高吞吐量的分布式

发布订阅消息系统，可以处理消费者在网站中的所有动作流数据。这种动作（网页浏览，搜索和其他用户的

行动）是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志

和日志聚合来解决。对于像Hadoop一样的日志数据和离线分析系统，但又要求实时处理的限制，这是一个

可行的解决方案。Kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理，也是为了通过

集群来提供实时的消息。



1.1 消息队列

Kafka 本质上是一个 MQ（Message Queue），使用消息队列的好处？

1.解耦：允许我们独立的扩展或修改队列两边的处理过程。

2.可恢复性：即使一个处理消息的进程挂掉，加入队列中的消息仍然可以在系统恢复后被处理。

3.缓冲：有助于解决生产消息和消费消息的处理速度不一致的情况。

4.灵活性&峰值处理能力：不会因为突发的超负荷的请求而完全崩溃，消息队列能够使关键组件顶住突发的

访问压力。

5.异步通信：消息队列允许用户把消息放入队列但不立即处理它。



1.2 发布/订阅模式

一对多，生产者将消息发布到 topic 中，有多个消费者订阅该主题，发布到 topic 的消息会被所有订阅者消

费，被消费的数据不会立即从 topic 清除。



2. 架构

Kafka 存储的消息来自任意多被称为 Producer 生产者的进程。数据从而可以被发布到不同的 Topic 主题下

的不同 Partition 分区。在一个分区内，这些消息被索引并连同时间戳存储在一起。其它被称为 Consumer

消费者的进程可以从分区订阅消息。Kafka 运行在一个由一台或多台服务器组成的集群上，并且分区可以跨

集群结点分布。

下面给出 Kafka 一些重要概念，让大家对 Kafka 有个整体的认识和感知，后面还会详细的解析每一个概念的

作用以及更深入的原理。

● Producer：消息生产者，向 Kafka Broker 发消息的客户端。

● Consumer：消息消费者，从 Kafka Broker 取消息的客户端。

● Consumer Group：消费者组（CG），消费者组内每个消费者负责消费不同分区的数据，提高消费能

力。一个分区只能由组内一个消费者消费，消费者组之间互不影响。所有的消费者都属于某个消费者组，即

消费者组是逻辑上的一个订阅者。

● Broker：一台 Kafka 机器就是一个 broker。一个集群由多个 broker 组成。一个 broker 可以容纳多个

topic。

● Topic：可以理解为一个队列，topic 将消息分类，生产者和消费者面向的是同一个 topic。

● Partition：为了实现扩展性，提高并发能力，一个非常大的 topic 可以分布到多个 broker （即服务器）

上，一个 topic 可以分为多个 partition，每个 partition 是一个有序的队列，可以理解为将标准 MQ 的

Queue 的消息进行拆分, 来实现高可用

Producer 发送的 Message, 根据 key 和 partition 数进行 hash, 然后进行投递，一个分区只能被同一个

Consumer Group 中的一个 Consumer 消费. 分区内消费有序。

● Replica：副本，为实现备份的功能，保证集群中的某个节点发生故障时，该节点上的 partition 数据不丢

失，且 Kafka 仍然能够继续工作，Kafka 提供了副本机制，一个 topic 的每个分区都有若干个副本，一个

leader 和若干个 follower。

● Leader：每个分区多个副本的“主”副本，生产者发送数据的对象，以及消费者消费数据的对象，都是

leader。

剩余17页未读，继续阅读

内容反馈

孤蓬&听雨

粉丝: 7063
资源: 326

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip