随着信息通信技术的发展,数据通信速度和质量不断提升,城市居民的日常活动从现
实空间逐渐扩展至网络空间,越发离不开以智能手机为载体的移动互联网。现实空间行为
与网络空间上网行为联系日益紧密,探讨个体在现实空间与网络空间的活动差异,建立现
实空间活动与虚拟网络空间活动的关联
[1-2]
,有助于个体出行行为预测的研究。
现有研究对移动行为关注较多,在个体移动方面,有关注个体移动行为模式
[3-6]
、活动
空间
[7-11]
等方面的研究;在出行预测方面,常用的方法包含马尔可夫(Markov)模型、频
繁模式挖掘以及神经网络和机器学习方法
[12-14]
;在构建位置预测模型方面,也有学者取得
了系列成果
[15-17]
。随着现实空间出行行为与网络空间上网行为联系日益紧密,国内外学者
从实证分析、行为预测、相关性分析等角度对现实空间与网络空间行为间的关系展开了研
究
[18-21]
。但少有研究探讨手机上网行为特征对个体出行行为预测的影响,应用多模型融合
技术预测个体出行位置的研究也较少。Markov 预测模型能构建基于停留点语义的出行链,
据此进行出行位置的预测,所得结果与实际出行场景更为贴近。机器学习的多分类方法是
基于统计的学习方法,准确率较高,但可解释性较差。文献[22]发现融合多个差异较大的
分类模型更能提升模型学习的效果,提高准确率。因此,本文利用手机基站位置更新数
据、上网数据、兴趣点(point of interest,POI)数据等多源数据,融合上网行为特征、
出行时空行为特征及外部因素特征,基于频率分布图的自适应融合规则,融合 Markov 模
型、机器学习多分类模型的预测结果来进行个体出行位置预测。
1. 出行位置预测模型的融合方法
1.1 Markov 预测模型
Markov 预测模型的核心思想是将历史数据中当前状态转移概率最大的状态作为下一
状态的预测值。根据 Markov 理论中转移概率的定义,需要通过条件概率来计算从当前状
态转移到下一状态的概率。转移概率在应用于个体出行位置预测时,其定义可参考文献
[23]。Markov 模型根据对当前状态描述的不同,可以分为一阶 Markov 和 kk 阶 Markov 模
型。一阶 Markov 模型仅使用当前时段的位置,对训练数据要求较低;kk 阶 Markov 模型
则使用更多的历史状态数据,预测的准确率更高,但存在对训练数据要求高、更易冷启动
的问题。因此,综合考虑一阶 Markov、多阶 Markov 预测模型的预测结果,有助于提高预
测准确率。Markov 模型的构建如图 1 所示。首先根据手机用户的位置更新数据,识别停
留点及其语义,构建出行链;然后计算手机用户出行的 kk 阶转移概率 pti,jpi,jt,构建多个
Markov 预测模型并进行准确率分析。具体计算公式如下:
评论0
最新资源