# 日志分析系统
## 系统架构
本使用kafka,spark,hbase开发日志分析系统。
![architecture](/docs/images/architecture.png "architecture")
### 软件模块
* Kafka:作为日志事件的消息系统,具有分布式,可分区,可冗余的消息服务功能。
* Spark:使用spark stream功能,实时分析消息系统中的数据,完成计算分析工作。
* Hbase:做为后端存储,存储spark计算结构,供其他系统进行调用
## 环境部署
### 软件版本
* hadoop 版本 : Hadoop相关软件如zookeeper、hadoop、hbase,使用的是cloudera的 cdh 5.2.0 版本。
* Kafka : 2.9.2-0.8.1.1
### 软件安装
a. 部署kafka
tar -xzf kafka_2.9.2-0.8.1.1.tgz
b. 编辑kafka 配置文件
config/server-1.properties:
broker.id=0
port=9093
log.dir=/tmp/kafka-logs
config/server-2.properties:
broker.id=1
port=9093
log.dir=/tmp/kafka-logs
config/server-3.properties:
broker.id=2
port=9093
log.dir=/tmp/kafka-logs
c. 启动kafka
bin/kafka-server-start.sh config/server-1.properties &
bin/kafka-server-start.sh config/server-2.properties &
bin/kafka-server-start.sh config/server-3.properties &
d. 创建kafka topic
> bin/kafka-topics.sh --create --zookeeper 10.10.102.191:2181, 10.10.102.192:2181, 10.10.102.193:2181 --replication-factor 3 --partitions 1 --topic recsys
e. 查看是否创建成功
> bin/kafka-topics.sh --list --zookeeper localhost:2181
> bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic my-replicated-topic
Topic:my-replicated-topic PartitionCount:1 ReplicationFactor:3 Configs:
Topic: my-replicated-topic Partition: 0 Leader: 1 Replicas: 1,2,0 Isr: 1,2,0
f. kafka启动测试
> bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
This is a message
This is another message
> bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginning
This is a message
This is another message
g. 注意事项
在开发程序的时候,producer客户端必须要配置上broker的host映射信息,即使你的程序中使用的都是ip地址。
## 项目开发
### 程序部署目录
/libs
* Logback包:logback-classic-1.1.2.jar,logback-core-1.1.2.jar
* Kafka包(在kafka安装包lib目录中)
/conf
* Logback:logback.xml
/webapps/recsys
* index.html
/
* logcount-1.0.jar
### Spark_Streaming 处理数据
### HBase 保存数据
创建hbase表
create ‘recsys_logs’,’f’
服务器端部署.服务器端启动了一个httpserver,该server需要将jar包中的html页面解压出来,所以先解压,后运行程序
jar xvf recsys-1.0.jar
#### 系统运行
客户端
> java -Dlogback.configurationFile=./conf/logback.xml -classpath .:libs/*:logcount-1.0.jar com.wankun.logcount.kafka.TailService dest.log
服务端
> spark-submit --class com.wankun.logcount.spark.LogStream --master spark://SparkMaster:7077 logcount-1.0.jar
### 注释
没有合适的资源?快使用搜索试试~ 我知道了~
使用kafka,spark,hbase开发日志分析系统
共30个文件
xml:6个
java:5个
class:5个
需积分: 50 24 下载量 84 浏览量
2018-10-12
22:14:49
上传
评论
收藏 232KB ZIP 举报
温馨提示
# 日志分析系统 ## 系统架构 本使用kafka,spark,hbase开发日志分析系统。 ![architecture](/docs/images/architecture.png "architecture") ### 软件模块 * Kafka:作为日志事件的消息系统,具有分布式,可分区,可冗余的消息服务功能。 * Spark:使用spark stream功能,实时分析消息系统中的数据,完成计算分析工作。 * Hbase:做为后端存储,存储spark计算结构,供其他系统进行调用 ## 环境部署 ### 软件版本 * hadoop 版本 : Hadoop相关软件如zookeeper、hadoop、hbase,使用的是cloudera的 cdh 5.2.0 版本。 * Kafka : 2.9.2-0.8.1.1
资源推荐
资源详情
资源评论
收起资源包目录
logcount-master日志统计分析.zip (30个子文件)
logcount-master日志统计分析
logcount-master
.project 537B
src
main
resources
hbase-site.xml 7KB
webapps
recsys
index.html 270B
logback.xml 2KB
java
com
wankun
logcount
kafka
TailService.java 617B
TailLog.java 3KB
MsgSender.java 2KB
spark
RecsysLogs.java 2KB
LogStream.java 4KB
target
classes
hbase-site.xml 7KB
com
wankun
logcount
kafka
MsgSender.class 2KB
TailLog.class 1KB
TailService.class 819B
spark
LogStream.class 7KB
RecsysLogs.class 3KB
META-INF
MANIFEST.MF 107B
maven
com.wankun
logcount
pom.properties 265B
pom.xml 2KB
webapps
recsys
index.html 270B
logback.xml 2KB
.settings
org.eclipse.m2e.core.prefs 86B
org.eclipse.jdt.core.prefs 238B
org.eclipse.core.resources.prefs 150B
README.md 3KB
pom.xml 2KB
docs
日志分析系统.docx 61KB
images
architecture.png 53KB
架构.ppt 262KB
.classpath 1KB
.gitignore 8B
共 30 条
- 1
资源评论
qq_25288411
- 粉丝: 2
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于plc的污水处理,组态王动画仿真,带PLC源代码,组态王源代码,图纸,IO地址分配
- MATLAB代码:考虑P2G和碳捕集设备的热电联供综合能源系统优化调度模型 关键词:碳捕集 综合能源系统 电转气P2G 热电联产 低碳调度 参考文档:Modeling and Optimiza
- 永磁同步直线电机仿真实例,仿真教学 maxwell16.0版本 12槽11极 包括图中模型以及一个仿真设置要点word文档教程
- 基于mpx+vue+node.js的双端网盘系统的设计与实现源代码全套技术资料.zip
- welearn刷时长版本v3.0.bat
- 前端分析-2023071100789-y5
- 前端分析-2023071100789
- 调查问卷系统源代码全套技术资料.zip
- C#实用教程郑阿奇梁敬东程序源代码及电子课件
- 环境监测系统源代码全套技术资料.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功