# 摘要
<div align="center"> <img src="fig/1.png" width = 800 height = 500 /> </div>
<div align="center"> <img src="fig/2.png" width = 800 height = 750 /> </div>
<div align="center"> <img src="fig/3.png" width = 800 height = 400 /> </div>
<div align="center"> <img src="fig/4.png" width = 800 height = 400 /> </div>
通过用户OD数据表示的行程信息的分段任务主要可以划分为两个部分,分别是行程链划分和行程段识别。行程链划分是指通过分析用户行程点将连续的用户行程划分为离散的行程段, 而行程段识别是指将离散的行程段与用户的出行方式相映射。对于用户出行链的预测问题, 本文使用了循环神经网络中经典的长短期记忆网络(LSTM), 我们将任务二中获得的数据用于训练LSTM, 使得LSTM能够很好地收敛。
对于行程链划分问题, 本文考虑使用五个属性, 即[经度, 纬度, 时间点, 速度, 乘坐地铁的可能性], 来对一个行程点进行描述, 然后通过基于高斯混合无监督聚类算法开发的时空-速度-权重-高斯混合聚类算法(TSSW聚类)对行程点进行聚类分析。其中,对于速度属性本文使用了KMeans聚类算法将连续的速度划分为十个离散的速度等级以增强聚类算法的易收敛性, 对于乘坐地铁的可能性本文设计了平滑的类Sigmoid函数来适应权重映射和反向梯度传播算法。
对于行程段识别问题,本文考虑使用全连接神经网络实现五维属性到出行方式的非线性映射。
对于行程链预测问题, 本文考虑使用三个属性, 即[经度,纬度,时间点], 来描述一个行程点。将任务二中人工和全连接神经网络标注的数据作为循环神经网络的训练集和验证集进行训练和检测。经实验证明, 我们的方法可以使LSTM很好地收敛。
除了在学术上的贡献,本文在软件工程领域也作出了贡献。在数据读取上,本文设计了Cache结构避免了对磁盘中的数据重复读取; 在轨迹处理上,本文去除了漂移点并使用卡尔曼滤波对轨迹进行平滑处理; 在高精度定位上,本文实现了WGS84到GCJ02坐标系的高精度转换,坐标可以精确到小数点五位; 在可视化设计上,本文设计了五维行程点到三维空间的投影和高精地图标点; 在代码风格上,本文的代码严格符合“高内聚,低耦合”和面向对象的设计思想。
综上, 本文以较高的软件工程水平实现了一个基于TSSW时空聚类、FCNN和RNN的时空大数据分析系统, 实现了对用户出行链的分段, 识别, 评估。
# 环境配置
- `pandas == 2.0.3`:用于数据处理和分析。
- `webbrowser`:用于在默认浏览器中打开地图文件。
- `folium = 0.14.0`:用于地图可视化。
- `datetime`:用于处理时间数据。
- `os`:用于系统操作。
- `torch`: 用于神经网络构建和训练
- `transbigdata`: 用于轨迹处理
# 使用方法
## 人工划分
```shell
python main.py cluster label
```
## FCNN划分
```shell
python main.py cluster FCNN
```
## 自动化用户轨迹标注与分析工具
```shell
python main.py Mission1
```
## FCNN全连接神经网络训练
```shell
python main.py train FCNN
```
## RNN循环神经网络训练
```shell
python main.py train FCNN
```
## RNN实现轨迹预测
```shell
python main.py predict
```
# 功能
1. 行程链划分及可视化,提供时空聚类分段方式和两种映射方式
1. 人工划分: 将经过时空聚类算法分类的簇与交通方式映射
2. 全连接神经网络: 利用训练好的全连接神经网络实现簇到交通方式的映射
2. 任务一中的自动化用户轨迹标注与分析工具
3. 全连接神经网络训练
4. RNN
1. 循环神经网络训练
2. 循环神经网络预测
# 作者
[葛钰峣 Yuyao Ge](https://github.com/GeYuYao-hub),[包启延 Qiyan Bao](https://github.com/sTTTST),[刘涛 Tao Liu](https://github.com/tingb0),[赵士轲 Shike Zhao](https://github.com/Zskkkkk) ,[张子扬 Ziyang Zhang](https://github.com/SOMNAMBULI1ST),[周镇涛 Zhentao Zhou](https://github.com/Nishino33),[毕嘉睿 Jiarui Bi](https://github.com/FeiXuePrime)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【项目资源】: 包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。 包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】: 所有源码都经过严格测试,可以直接运行。 功能在确认正常工作后才上传。 【适用人群】: 适用于希望学习不同技术领域的小白或进阶学习者。 可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】: 项目具有较高的学习借鉴价值,也可直接拿来修改复刻。 对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】: 有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 鼓励下载和使用,并欢迎大家互相学习,共同进步。
资源推荐
资源详情
资源评论
收起资源包目录
本文以较高的软件工程水平实现了一个基于TSSW时空聚类、FCNN和RNN的时空大数据分析系统, 实现了对用户出行链的.zip (31个子文件)
资料总结
RNNpredicter.py 1KB
fcnn_gpu.py 4KB
doc
任务一.pdf 483KB
任务二及任务三.pdf 6.34MB
RNNTrainer.py 4KB
main.py 2KB
Mission1
任务1-地铁轨迹数据标注 - 副本.csv 75KB
任务1-地铁轨迹数据标注.csv 71KB
master.py 6KB
Network.py 436B
utils
map_builder.py 3KB
cluster.py 5KB
tools.py 6KB
__pycache__
interactional.cpython-310.pyc 3KB
cluster.cpython-310.pyc 4KB
map_builder.cpython-310.pyc 2KB
tools.cpython-310.pyc 7KB
interactional.py 4KB
master.py 6KB
datasets.py 8KB
.gitignore 108B
script
iso_Forest.py 1KB
get_SubwayCoordinates.py 1019B
ComparisonCluster.py 2KB
README.md 4KB
fig
3.png 194KB
1.png 266KB
log.png 37KB
rnn_log.png 24KB
4.png 417KB
2.png 566KB
共 31 条
- 1
资源评论
妄北y
- 粉丝: 1w+
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功