kafkapython教程-Kafka快速入门（十二）-Python客户端.pdf_kafka-python资源-CSDN文库

82 浏览量 2023-06-11 09:42:36 上传评论收藏 206KB PDF 举报

资源推荐

资源详情

资源评论

kafkapython教程_Kafka快速⼊门（⼗⼆）——Python客户端

Kafka快速⼊门(⼗⼆)——Python客户端

⼀、confluent-kafka

1、confluent-kafka简介

confluent-kafka是Python模块，是对librdkafka的轻量级封装，⽀持Kafka 0.8以上版本。本⽂基于confluent-kafka 1.3.0编写。

GitHub地址：

2、confluent-kafka特性

(1)可靠。confluent-kafka是对⼴泛应⽤于各种⽣产环境的librdkafka的封装，使⽤Java客户端相同的测试集进⾏测试，由Confluent进⾏

⽀持。

(2)性能。性能是⼀个关键的设计考虑因素，对于较⼤的消息，最⼤吞吐量与Java客户机相当(Python解释器的开销影响较⼩)，延迟与Java

客户端相当。

(3)未来⽀持。Coufluent由Kafka创始⼈创建，致⼒于构建以Apache Kafka为核⼼的流处理平台。确保核⼼Apache Kafka和Coufluent

平台组件保持同步是当务之急。

3、confluent-kafka安装

创建confluent源：

进⼊/etc/yum.repos.d⽬录创建confluent.repo⽂件：

[Confluent.dist]

name=Confluent repository (dist)

gpgcheck=1

enabled=1

[Confluent]

name=Confluent repository

gpgcheck=1

enabled=1

安装：

sudo yum clean all && sudo yum install confluent-community-2.12

sudo yum install librdkafka-devel python-devel

pip install confluent-kafka

安装AvroProducer、AvroConsumer：

pip install "confluent-kafka[avro]"

⼆、coufluent-kafka客户端API

1、confluent_kafka.Consumer

Consumer(config)

使⽤指定的配置dict创建Consumer实例。

Consumer.assign(partitions)

由指定TopicPartition列表设置Consumer的分区分配策略，启动消费。如果对关闭的Consumer调⽤本函数会抛出RuntimeError。

Consumer.assignment()

返回当前分区分配策略，返回list(TopicPartition)

Consumer.close()

关闭和终⽌Consumer实例，关闭Consumer实例会执⾏以下操作：停⽌消费；提交位移(如果enable.auto.commit设置为False会抛出异

常)、离开Consumer Group。

Consumer.commit([message=None][, offsets=None][, asynchronous=True])

提交⼀条消息或位移列表，message和offsets是互斥参数，如果没有指定参数，会使⽤当前分区分配策略的offsets。

message：提交消息的位移加1

offsets：要提交的TopicPartition列表

asynchronous：是否异步提交。异步提交会⽴即返回None。如果设置为False，会阻塞直到提交成功或失败，如果提交成功，会返回提交

的offsets。注意：提交成功，需要对返回的TopicPartition列表的每个TopicPartition的err字段进⾏检查，TopicPartition可能会提交失

败。

Consumer.committed(partitions[, timeout=None])

获取已提交的分区的offsets。

partitions：TopicPartition列表

timeout：请求超时，单位秒。

返回TopicPartition列表或错误集

Consumer.consume([num_messages=1][, timeout=-1])

消费消息，调⽤回调函数，返回消息列表，如果超时，返回空。

应⽤程序必须检查返回Message的error⽅法，正常Message的error返回None。

num_messages：返回的最⼤消息数量，默认为1

timeout：阻塞等待消息、事件、回调函数的最⼤时间

Connsumer.get_watermark_offsets(partition[, timeout=None][, cached=False])

获取分区的低⽔位和⾼⽔位

partition：TopicPartition对象

Timeout：请求超时，

Cached：是否替换正在查询的Broker使⽤的缓存信息。

成功返回低⽔位和⾼⽔位的元组，超时返回None。

Consumer.list_topics([topic=None][, timeout=-1])

请求集群的元数据信息。

topic：字符串类，如果指定，只请求本Topic的信息，否则返回集群的所有Topic。

timeout：超时前的最⼤响应时间，-1表⽰永不超时。

返回ClusterMetadata类型

Consumer.offsets_for_times(partitions[, timeout=None])

剩余14页未读，继续阅读

内容反馈

是空空呀

粉丝: 167
资源: 3万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip