Flink实战:用户行为分析之热门商品实战:用户行为分析之热门商品TopN统计统计
环境环境
ubuntu14、flink1.7.2、scala2.11、kafka2.3.0、jdk1.8、idea2019
步骤步骤
抽取出业务时间戳,告诉 Flink 框架基于业务时间做窗口
过滤出点击行为(pv)数目
按一小时的窗口大小,每 5 分钟统计一次,做滑动窗口聚合(Sliding Window)
按每个窗口聚合,输出每个窗口中点击量前 N 名的商品
实现实现
创建maven项目,命名UserBehaviorAnalysis,其pom内容如下:
4.0.0
com.ustc
UserBehaviorAnalysis
pom
1.0-SNAPSHOT
1.7.2
2.11
2.3.0
HotItemsAnalysis
org.apache.flink
flink-scala_${scala.binary.version}
${flink.version}
org.apache.flink
flink-streaming-scala_${scala.binary.version}
${flink.version}
org.apache.kafka
kafka_${scala.binary.version}
${kafka.version}
org.apache.flink
flink-connector-kafka_${scala.binary.version}
${flink.version}
net.alchim31.maven
scala-maven-plugin
3.4.6
testCompile
org.apache.maven.plugins
maven-assembly-plugin
3.0.0
jar-with-dependencies
make-assembly
package
single
在该项目中创建子模块(右击->module),取名 HotItemsAnalysis,其pom内容(保持默认内容即可):
UserBehaviorAnalysis
com.ustc
1.0-SNAPSHOT
评论0
最新资源