没有合适的资源?快使用搜索试试~ 我知道了~
kafka-twitter-spark-streaming:实时计算每个用户的推文
共4个文件
py:3个
md:1个
需积分: 6 0 下载量 65 浏览量
2021-02-06
11:20:09
上传
评论
收藏 3KB ZIP 举报
温馨提示
Apache Kafka的Twitter和Spark流 该项目实时统计每个用户包含#GoTS7主题标签的推文。 此外,还会打印用户名和推文计数。 代码说明 身份验证操作已通过Python的Tweepy模块完成。 为Twitter流创建了名为KafkaPushListener的StreamListener。 StreamListener为Kafka Consumer生成数据。 产生的数据已被过滤掉,其中包括《权力的游戏》主题标签。 创建SparkContext来连接Spark集群。 创建了使用“ twitter”主题中的数据的Kafka Consumer。 计算每个用户包含#GotS7
资源推荐
资源详情
资源评论
收起资源包目录
kafka-twitter-spark-streaming-master.zip (4个子文件)
kafka-twitter-spark-streaming-master
README.md 2KB
kafka_push_listener.py 1KB
kafka_twitter_spark_streaming.py 1KB
twitter_config.py 293B
共 4 条
- 1
资源评论
参丸
- 粉丝: 16
- 资源: 4658
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功