【免费】kafka18道面试题和答案.docx资源-CSDN文库

需积分: 0 88 浏览量更新于2023-06-14 收藏 17KB DOCX 举报

Kafka 是一个分布式流处理平台，常用于实时数据处理和消息传递。以下是一些关于 Kafka 的关键知识点，基于提供的面试题和答案： 1. **获取 Topic 列表**：使用 `bin/kafka-topics.sh` 命令，配合 `--list` 参数和 `--zookeeper` 选项，可以列出运行在 `localhost:2181` 的 ZooKeeper 上的所有 Topic。 2. **生产者和消费者的命令行工具**： - **生产者**：`bin/kafka-console-producer.sh` 使用 `--broker-list` 参数指定 Broker 地址（如 `192.168.43.49:9092`）和 `--topic` 参数设置 Topic 名（如 `Hello-Kafka`）。用户在命令行输入的每一行都会作为一条消息发布。 - **消费者**：`bin/kafka-console-consumer.sh` 使用 `--zookeeper` 参数连接 ZooKeeper，`--topic` 参数指定要消费的 Topic，`--from-beginning` 参数表示从头开始消费。 3. **生产者与消费者的模式**：Kafka 采用 **Pull（拉取）模式**。Producer 将消息推送到 Broker，Consumer 从 Broker 拉取消息。Pull 模式允许 Consumer 自主控制消费速率，避免了 Push 模式中 Broker 控制速率可能导致的问题。Consumer 可以决定是否批量拉取数据，提高效率。 4. **消费状态跟踪**：Kafka 使用 **Offset** 来追踪每个分区的消费状态。每个分区有一个唯一的整数 Offset，代表消息的顺序。Consumer 记录已消费的分区和对应的 Offset，以便下次从上次离开的位置继续消费。这种设计允许 Consumer 回溯到较早的 Offset 重新消费，提供了消息重放的能力。 5. **消息系统的必要性**： - **解耦**：消息队列允许生产者和消费者独立工作，只需要遵循相同的接口，增强了系统的灵活性和可扩展性。 - **冗余与数据安全性**：消息持久化存储，即使处理过程中发生故障，也能避免数据丢失。 - **幂等性**：Kafka 支持消息重复消费，通过记录 Offset，可以避免因消息重复而导致的问题。 6. **对比 MySQL**：尽管 MySQL 等数据库可以实现基本的数据存储和传输，但它们不提供消息队列的特性，如异步处理、解耦、冗余和高吞吐量。消息系统更适合大规模实时数据流场景，能处理大量并发读写，同时保证数据的有序性和一致性。 7. **Kafka 的其他特性**： - **分区与并行处理**：Topic 分区允许多 Consumer 并行消费，提高处理速度。 - **高可用与容错**：通过副本机制，Kafka 可以在节点故障时自动恢复服务，保证服务连续性。 - **延迟与吞吐**：Kafka 设计优化了批量操作，能实现低延迟和高吞吐的数据传输。这些知识点涵盖了 Kafka 的基本原理、操作工具以及它在消息传递和数据处理中的优势。理解并掌握这些概念对使用和设计 Kafka 系统至关重要。

如何获取 topic 主题的列表

bin/Kafka-topics. sh -list --zookeeper localhost:2181

生产者和消费者的命令行是什么?

生产者在主题上发布消息：

1、bin/Kafka-console-producer. sh --broker-list 192.168.43.49:9092--topic Hello-Kafka

2、注意这里的 IP 是 server. properties 中的 listeners 的配置。接下来每个新行就是输入一条新消息。

3、消费者接受消息：

4、bin/Kafka-console-consumer. sh --zookeeper localhost:2181 -topic Hello-Kafka--from-beginning

consumer 是推还是拉?

1、Kafka 最初考虑的问题是,customer应该从 brokes拉取消息还是 brokers 将消息推送到 consumer,也

就是 pull 还 push。在这方面,Kafka 遵循了一种大部分消息系统共同的传统的设计:producer 将消息推

送到 broker,consumer 从 broker 拉取消息。

2、一些消息系统比如 Scribe 和 Apache Flume 采用了 push 模式,将消息推送到下游的 consumer。这

样做有好处也有坏处：由 broker 决定消息推送的速率，对于不同消费速率的 consumer 就不太好处

理了。消息系统都致力于让 consumer 以最大的速率最快速的消费消息，但不幸的是，push 模式下，

当 broker 推送的速率远大于 consumer 消费的速率时,consumer 恐怕就要崩溃了。最终 Kafka 还是选

取了传统的 pull 模式。

3、Pull 模式的另外一个好处是 consumer 可以自主决定是否批量的从 broker 拉取数据。Push 模式必

须在不知道下游 consumer 消费能力和消费策略的情况下决定是立即推送每条消息还是缓存之后批

量推送。如果为了避免 consumer 崩溃而采用较低的推送速率，将可能导致一次只推送较少的消息

而造成浪费。Pull 模式下，consumer 就可以根据自己的消费能力去决定这些策略。

4. Pull 有个缺点是,如果 broker 没有可供消费的消息,将导致 consumer 不断在循环中轮询，直到新消

息到 t 达。为了避免这点，Kafka 有个参数可以让 consumer 阻塞知道新消息到达(当然也可以阻塞知

道消息的数量达到某个特定的量这样就可以批量发送)。

讲讲 Kafka 维护消费状态跟踪的方法

1、大部分消息系统在 broker 端的维护消息被消费的记录：一个消息被分发到 consumer 后 broker 就

马上进行标记或者等待 customer 的通知后进行标记。这样也可以在消息在消费后立马就删除以减

少空间占用。

2、但是这样会不会有什么问题呢?如果一条消息发送出去之后就立即被标记为消费过的，一旦

consumer 处理消息时失败了(比如程序崩溃)消息就丢失了。为了解决这个问题，很多消息系统提供

了另外一个个功能：当消息被发送出去之后仅仅被标记为已发送状态，当接到 consumer 已经消费

成功的通知后才标记为已被消费的状态。这虽然解决了消息丢失的问题，但产生了新问题，首先

如果

下载后可阅读完整内容，剩余4页未读，立即下载

资源推荐

资源评论

向前齐步走

粉丝: 60
资源: 2904

kafka 18道面试题和答案.docx

最新资源

kafka 18道面试题和答案.docx

kafka 35道面试题和答案.docx

Kafka 17道面试题和答案.docx

Kafka 40道面试题和答案.docx

Kafka 50道面试题和答案.docx

kafka面试题.docx

Notepad++安装包

安卓期末大作业（AndroidStudio开发），垃圾分类助手app，分为前台后台，代码有注释，均能正常运行

RocketMQ 可视化工具 Dashboard下载

微信小程序源码-合集1.rar

SwitchHosts

ruoyi-vue-pro 芋道源码项目的表结构

ruoyi-vue-pro sql

jdk 17.0.13 版本

jdk-8u431-windows-x64

JDK1.8 windows 64位

图书管理系统(Java实现）[附完整代码]

myeclipse 10.7.1 windows 安装包

jdk-11-windows-x64.zip

kkFileView-4.4.0-beta Windows + linux 打包版

最新资源