## 代码结构
`cn/edu/whu/glink/areadetect`包下为用于实现分布式热点区域识别的核心代码, 基本过程依次为:
1. 上下客点->监控单元映射
2. 热点单元识别
3. 并行热点区域识别
4. 热点区域合并
其中热点区域合并部分提供了两种实现方式:
1. 分布式实现(distributed), 借鉴MR-DBSCAN多阶段聚合的实现策略.
2. 集中式实现(centralized), 将所有热点区域汇聚至单节点上, 借助R-tree合并各热点区域几何.
`cn/edu/whu/glink/examples`包下为论文中基于纽约市/武汉市出租车数据集实现分布式聚类的代码, 其中纽约市实验中使用Kafka作为数据源,
武汉市实验中使用文件作为数据源, 相关的数据文件与预处理代码已省略, 所读取数据记录的格式为:
```
time,lng,lat,type
```
纽约市数据集为公开数据集, 可至[此处](https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page)下载.
`cn/edu/whu/glink/examples/threshold`包中实现了单峰阈值选取算法, 基于给定的监控单元大小与时间窗口, 为数据集计算推荐的热点阈值.
## 运行
### 1. Maven打包
```
mvn clean package
```
### 2. 提交作业
```
cd areadetect/target
flink run -p 1 -c cn.edu.whu.glink.examples.nyc.Job ./HotAreaDetect-0.1-SNAPSHOT-jar-with-dependencies.jar 0.1 10 10 7 10 nyc-2015-JAN cent
```
其中, `-p`指定了作业的并行度, 末尾的7个参数依次为:
0.1 10 10 7 10 nyc-2015-JAN cent
- 监控单元大小s
- 热点识别滑动窗口长度
- 热点识别滑动窗口步长
- 热点阈值v
- 分区大小pSize
- 作业消费的Kafka Topic
- 算法类型, `dist`为分布式算法, 为论文中所提出的方法, `cent`为集中式算法, 为论文中baseline.
### 3. 成果展示
热点区域以Geometry对象的形式输出, `userData`中含有该热点区域的ID, 时间, 面积, 热点单元平均上下客密度, 可使用`cn.edu.whu.glink.examples.shp.ShapeFileUtil`转为shp文件实现可视化.
没有合适的资源?快使用搜索试试~ 我知道了~
基于Flink空间兴趣区域识别算法源码+部署文档+全部资料齐全 高分项目.zip
共57个文件
java:34个
ds_store:11个
iml:4个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 127 浏览量
2024-05-13
19:18:17
上传
评论
收藏 74KB ZIP 举报
温馨提示
【资源说明】 基于Flink空间兴趣区域识别算法源码+部署文档+全部资料齐全 高分项目.zip基于Flink空间兴趣区域识别算法源码+部署文档+全部资料齐全 高分项目.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
基于Flink空间兴趣区域识别算法源码+部署文档+全部资料齐全 高分项目.zip (57个子文件)
FlinkHotAreaDetect-main
abnormal_detect.iml 574B
.DS_Store 6KB
pom.xml 2KB
readme.md 2KB
areadetect
.DS_Store 6KB
areadetect.iml 951B
pom.xml 5KB
HotAreaDetect.iml 14KB
src
.DS_Store 6KB
test
.DS_Store 6KB
main
.DS_Store 6KB
resources
points_example.txt 419B
log4j.properties 329B
java
.DS_Store 6KB
cn
edu
whu
.DS_Store 6KB
glink
.DS_Store 6KB
examples
threshold
ThresholdJob.java 5KB
ThresholdCalculator.java 3KB
wuhan
Job.java 3KB
shp
ShapeFileUtil.java 5KB
io
KafkaUtil.java 2KB
FileSink.java 1001B
FileSource.java 1KB
RawRecordParser.java 958B
nyc
Job.java 5KB
areadetect
.DS_Store 8KB
index
GridIndex.java 2KB
GeographicalGridIndex.java 9KB
TreeIndex.java 2KB
TRTreeIndex.java 3KB
core
HotAreaPropCalculator.java 283B
UniGridInfoJoiner.java 2KB
LocalAreaDetect.java 4KB
PointToDetectUnitMapper.java 1013B
AreaDetect.java 5KB
HotDetectUnit.java 2KB
combine
centralized
CentralizedCombiner.java 3KB
distributed
Local2GlobalMapRuleGetter.java 2KB
LocalAreaLinkFinder.java 3KB
HotAreaFinalCombiner.java 2KB
RedundantRouter.java 928B
datatypes
MapRule.java 490B
AreaID.java 1KB
HotArea.java 2KB
PickDropPoint.java 998B
DetectUnit.java 2KB
AreaIDLink.java 1KB
BoundaryID.java 899B
util
DistanceCalculator.java 366B
GeoUtils.java 3KB
GeographicalDistanceCalculator.java 518B
.DS_Store 6KB
.DS_Store 6KB
.gitignore 298B
realtime_area_detect.iml 190B
部署说明文档.md 14KB
171265889347208773632.zip 416B
共 57 条
- 1
资源评论
不走小道
- 粉丝: 3210
- 资源: 5120
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功