没有合适的资源?快使用搜索试试~ 我知道了~
UCTB:时空人群流动预测工具箱.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 126 浏览量
2022-11-28
20:30:30
上传
评论
收藏 633KB DOCX 举报
温馨提示
试读
16页
UCTB:时空人群流动预测工具箱.docx
资源推荐
资源详情
资源评论
人群流动预测是城市计算中的关键问题,在城市资源调度、城市规划与安
全预警等场景有着诸多应用
[1]
,人群流动预测技术对优化社会资源作用明显,对
社会稳定与繁荣的意义重大。与此同时,传感器网络、移动智能终端的普及和
位置获取技术的发展带来了海量具有时间和地理信息的数据,例如车速、供需
强度与人群流量数据等,这些具有时间和空间属性的数据被称为时空数据。大
量丰富的时空数据为预测人群的流动提供了良好的数据基础。
人群流动预测应用范围广泛,如预先调度空闲车辆至热点需求区域、预测
地铁站峰值人流等。事实上,城市范围内与人群的迁移、流动相关的应用问题
都可以被称为人群流动预测问题。人群流动预测问题因具有非线性、受多种因
素影响等特点,难以实现精准的预测。
历经多年的研究与发展,国内外学者在时空人群流动预测领域做了大量的
努力。早期研究将人群流动预测问题作为经典的时间序列预测问题,如整合移
动平均自回归模型(autoregressive integrated moving average,ARIMA)
[2]
和
历史均值法(historical mean,HM)。线性模型 ARIMA 和 HM 不能很好地建模
人群流动的非线性特性。后来有许多非线性算法被运用在时空人群流动预测问
题上,如马尔可夫随机场(Markov random field,MRF)
[3]
、决策树方法
[4]
等。随
着深度学习技术的发展,深度学习技术被广泛运用于交通流量的预测
[5]
,循环神
经 网 络 ( recurrent neural network,RNN) 及 其 变 种 ,主 要 包 括 LSTM( long
short- term memory)
[6]
与 GRU( gated recurrent network)
[7]
,因 其 具 有良 好
的捕获序列信息的能力,被广泛运用于交通预测中
[8]
。然而上述模型通常只考虑
了预测值与过去值在时间维度上的依赖性,并没有很好地利用空间依赖。
空间跨度上的依赖也是人群流动的一大特性,例如相邻的站点更可能具有
相 似 的 流 量 , 具 有 相 似 功 能 的 站 点 的 流 量 模 式 相 似
[9]
等 。 卷 积 神 经 网 络
(convolutional neural network,CNN)在人脸识别、目标检测等领域大放异彩,
已被证实能够很好地提取欧式数据(例如图像)的特征,学者们将城市划分大
小为 m×n 的图像,然后使用 CNN 捕获空间依赖
[10,11,12,13]
,CNN 可以通过残差单
元(residual unit)被堆叠得十分深,进而能够捕获长距离依赖
[12]
。对于社交网
络 等 非 欧式 数据 ,CNN 无法 直 接 使用,图 卷 积 神经网 络 (graph convolutional
network,GCN)应运 而生,许多基 于 GCN 的时空模型 被应用于 交通流 量 预测
[14,15,16,17]
。例 如 DCRNN( diffusion convolution recurrent neural network)
[14]
将图卷积 视作双 向图上的扩 散过程,以 捕获交 流流量的空 间依赖。ST-MGCN
(spatio-temporal multi-graph convolution network)
[16]
将多种空间知识与循环
神经网络结合起来捕获流量特征。随着注意力机制的发展,越来越多的基于注
意力机制的模型被提出
[18,19,20]
,许多带有自注意力(self-attention)与多端注意
力机制(multi-head attention mechanism)的模型也被用于预测人群流动,例
如 Liang 等人
[18]
利用多层次注意力机制捕获传感器网络的时空依赖,Wang 等人
[20]
利用图注意网络捕获流量的空间依赖,同时使用 transformer
[21]
模型捕获长期
时间依赖。
上述研究广泛地探究了人群流动的时间和空间依赖(也被称为时空先验知
识),这些知识能够帮助模型更好地捕获人群的流动模式,但时空知识种类繁多,
全面地利用这些知识是一件十分困难的事情。另一方面,许多新颖的模型都被
冠以“先进”的标签,证实这一点最直接的方法就是与其他基准模型进行对比,但
对这些模型进行复现是一件费时而困难的事情。虽然深度学习社区一直在倡导
着开源,也 有许 多相关的源代码 被开源出来( https://github.com/lehaifeng/T-
GCN, https://github.com/xiaochus/Traff-icFlowPrediction) ,但 这 些代 码 通 常
较为分散,只包含了一种或少许几种模型,且不同作者在深度学习框架的选择上
与数据的组织上各不相同,因此,很难直接利用这些开源代码在同一个环境下进
行实验。针对上述痛点,本文基于 TensorFlow
[22]
实现了一款面向时空人群流动
预测应用的工具箱(urban computing tool box,UCTB),旨在为研究、从业人
员提供如下便利:
(1)工具箱集成了时空人群流动领域常用的时空知识,提供了统一的数据
处理接口以便利用不同类型的时空先验知识。同时由于数据接口的统一,工具
箱内集成的各类模型能够直接进行比较。
(2)工具箱既集成了经典预测模型,也集成了先进的深度学习模型,以便快
速复现各类模型,同时工具箱还提供了许多可复用的高级模型层,以加速用户对
新模型的开发。
(3)为了便于用户快速上手,还编写了详细易懂的配套文档,所有的模型与
自 定 义 模 块 均 有 示 例 以 供 参 考 。 UCTB 工 具 箱 的 网 址 是
https://github.com/uctb/UCTB, 配 套 文 档 的 网 址 是
https://uctb.github.io/UCTB/。
1 框架设计
机器学习算法执行的一般流程是:读取与预处理数据、构建模型、训练以
及评估模型。与这一基本思路相对应,UCTB 工具箱由数据处理、模型构建、模
型训练与评估三大模块组成(见图 1)。
图 1
图 1 UCTB 整体框架
Fig.1 Framework of UCTB
在数据处理模块中,定义了一种可被运用于各类人群流动预测应用的通用
数据集。基于通用数据集,利用时空先验知识设计了时空特征提取接口;在模型
构建模块当中,对经典的人群流动预测模型进行了实现,同时解耦了一些可被复
用的高级的模型层;在训练与评估模块,对 UCTB 中的训练与评估机制进行了介
绍。
1.1 数 据处 理
UCTB 工具箱对原始数据的处理分为两大阶段完成:第一阶段将不同的原
始数据转化为 UCTB 通用数据集格式;第二阶段基于时空先验知识从通用数据
集中提取不同类型的时空特征。
1.1.1 数据集的中间件:通用数据集
人群流动的原始数据来源于种类繁多的传感器,例如地铁站的闸机记录了
进出站数据,公路上的速度传感器记录了当前车流速度,来自于多种应用场景的
数据处理过程无法统一。针对这一问题,本文设计了一种统一的数据集格式,作
为原始数据和特征的“中间件”,用户只需要先将不同数据处理成该格式,进而能
够利用 UCTB 工具箱提取不同特征。UCTB 通用数据集是原始数据与特征的“中
间 件 ”, 以 键 值 对 ( key-value pair ) 的 形 式 通 过 pickle 协 议
( https://docs.python.org/3/library/pickle.html)存储,主要的键值对信息列于
表 1。
表 1 UCTB 通用数据集格式
Table 1 Datasets format in UCTB
键
值(含义)
TimeRange
数据的时间范围
TimeFitness
数据的时间粒度
Node
存储节点型数据
Grid
存储网格型数据
ExternalFeature
存储外部特征
新窗口打开| 下载 CSV
1.1.2 特征提取
特征提取是利用先验知识将流量转化为各种特征,使得预测模型能够更好
地捕获人群流量的各种模式,这些专家知识主要包括时间知识和空间知识。时
间知识从不同视角反映了未来的流量值与过去哪些时刻的流量值相关,按照不
同的时间知识对数据按照不同时间间隔进行采样便能提取出时间特征(见图
2)。
图 2
剩余15页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3906
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功