没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
使用Kafka传输维基百科事件 这个简单的Python脚本利用了 Web服务,该服务通过遵循SSE协议的HTTP公开结构化事件流。 这些事件包括有关Wikipedia网页编辑,创建新网页等信息。 为了这个项目,我们只过滤掉与编辑现有页面有关的事件。 这些事件将被解析为适当的格式,并被发送回Kafka主题。 我们使用以下格式构造发送到Kafka的事件: { " id " : 1426354584 , " domain " : " www.wikidata.org " , " namespace " : " main namespace " , " title " : " articles_title " , " timestamp " : " 2021-03-14T21:55:14Z " , " user_name " : " a_user_name " , " user_t
资源推荐
资源详情
资源评论
收起资源包目录
kafka-wikipedia-data-stream-master.zip (4个子文件)
kafka-wikipedia-data-stream-master
wikipedia_events_kafka_producer.py 4KB
requirements.txt 128B
.gitignore 2KB
README.md 1KB
共 4 条
- 1
资源评论
笨猫猪
- 粉丝: 30
- 资源: 4732
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功