### 基于Flume + Kafka + Spark的电商实时访问日志分析系统
---
#### 项目结构
![image-20220831212711611](README.assets/image-20220831212711611.png)
#### 1.python部分
考虑到要实时大量数据,我们利用python脚本随机产生网站log数据,数据结构如下:
```
ip time categoryId refer statusCode
124.128.8.136 2022-08-28 16:27:13 "GET gmall.com/4 HTTP/1.0" - 404
125.58.128.237 2022-08-28 16:27:13 "GET gmall.com/1 HTTP/1.0" https://www.google.com/web?key=苹果 200
220.160.49.229 2022-08-28 16:27:13 "GET gmall.com/1 HTTP/1.0" - 302
58.82.124.11 2022-08-28 16:27:13 "GET gmall.com/6 HTTP/1.0"
203.134.240.136 2022-08-28 16:27:13 "GET gmall.com/3 HTTP/1.0" - 200
203.135.160.86 2022-08-28 16:27:13 "GET phone/130 HTTP/1.0" https://www.baidu.com/s?key=苹果 302
120.243.249.45 2022-08-28 16:27:13 "GET laptop/821 HTTP/1.0" - 200
202.127.160.136 2022-08-28 16:27:13 "GET gmall.com/2 HTTP/1.0" https://www.google.com/web?key=华为 200
118.102.16.23 2022-08-28 16:27:13 "GET gmall.com/1 HTTP/1.0" https://www.baidu.com/s?key=小米 200
```
可通过定时执行和调度器工具实时产生数据
**放在虚拟机中执行,通过flume监控日志文件并传给kafka**
#### 2.spark部分
通过SparkStreaming获取,Kafka消费到的实时数据,进行数据清洗等操作,处理得到需求所需数据保存到Hbase数据库中
四条需求对应4张图
**之后用Sparingboot调用Hbase数据,通过web进行可视化相关代码放在我的商城项目里面了**
**虚拟机环境**:Ubuntu20 \ jdk8 \ hadoop3.2.2 \ scala2.12.15 \ spark3.2.0 \ Hbase2.4.13
![img](README.assets/clip_image002.png)
项目参考:[https://www.bilibili.com/video/BV11E411Z7Sn?p=31&spm_id_from=333.880.my_history.page.click&vd_source=5d7574a243e53b28fc020a94b13de257](https://www.bilibili.com/video/BV11E411Z7Sn?p=31&spm_id_from=333.880.my_history.page.click&vd_source=5d7574a243e53b28fc020a94b13de257)
项目资料:
链接:https://pan.baidu.com/s/1QAG5ybRFFCHd28YrXoPTJg
提取码:xyxy
qq:2251634767
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
- 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 --------
资源推荐
资源详情
资源评论
收起资源包目录
gmall_log-main.zip (30个子文件)
gmall_log-main
spark
demo1
pom.xml 3KB
src
main
scala
ip.txt 13.71MB
com
xyxy
data
StatStreamingApp.scala 4KB
utils
HBaseUtils.java 3KB
DataUtils.scala 565B
IPLocationDemo.scala 2KB
dao
CategaryClickCountDAO.scala 1KB
VisitCountDAO.scala 1KB
BrandCountDAO.scala 1KB
IPLocationCountDAO.scala 1KB
bean
IPLocationCount.scala 86B
KeyWordCount.scala 78B
CategaryClickCount.scala 96B
VisitCount.scala 120B
ClickLog.scala 123B
BrandCount.scala 78B
ip.txt 13.71MB
.idea
jarRepositories.xml 845B
codeStyles
codeStyleConfig.xml 149B
Project.xml 263B
uiDesigner.xml 9KB
misc.xml 528B
compiler.xml 690B
.gitignore 233B
encodings.xml 186B
python
data.log 8KB
generate_data.py 13KB
README.assets
clip_image002.png 77KB
image-20220831212711611.png 99KB
README.md 2KB
共 30 条
- 1
资源评论
机器学习的喵
- 粉丝: 518
- 资源: 1269
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 本科毕业设计基于C# wpf人脸识别的考勤系统的设计与实现源码.zip
- 基于Ruoyi+uniapp实现学生考勤系统 学生考勤源码+项目说明.zip
- feae6bc968ca68a099455d8b8a8dea35
- 基于Pytorch训练CIRAR10上分类算法.zip
- Pytorch-pytorch深度学习教程之Tensorboard.zip
- 基于C++和Python开发yolov8-face作为人脸检测器dlib作为人脸识别器的人脸考勤系统源码+项目说明.zip
- Pytorch-pytorch深度学习教程之变分自动编码器.zip
- Pytorch-pytorch深度学习教程之神经风格迁移.zip
- Pytorch-pytorch深度学习教程之深度残差网络.zip
- Pytorch-pytorch深度学习教程之循环神经网络.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功