没有合适的资源?快使用搜索试试~ 我知道了~
基于GPS数据的出租车出行需求预测研究.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 69 浏览量
2022-11-28
20:31:45
上传
评论
收藏 454KB DOCX 举报
温馨提示
试读
13页
基于GPS数据的出租车出行需求预测研究.docx
资源推荐
资源详情
资源评论
0. 引言
互联网+交通的发展促进了“网约车”的快速发展,但由于乘客出行的随机性与空载出
租车司机寻找乘客的盲目性,导致出租车供需时空分布严重不平衡,出租车空载时间和空
驶里程增加,交通资源利用水平低,进一步加剧城市道路拥堵。部分地区出租车数量供给
不足,这样很容易出现打车难的现象,且等车时间长影响乘客出行体验。因此,为有效地
的提高载客率、改善乘车体验,挖掘出租车载客热区进而实现实时调度成为解决该问题的
重要手段。
1)出行分布特征研究。诸多学者对出租车出行时空分布特征进行了研究。曹梁
[1]
研究
了上海地区乘客出行规律;付鑫等
[2]
采用 ArcGIS 建立 OD 矩阵,分析了出租车出行时空特
征;张俊涛等
[3]
采用路径识别算法,对时空分布规律进行了研究;J.A. Alvarez-garcia 等
[4]
采
用隐马尔可夫算法对出租车行驶时的特征进行了分析。
通过分析乘客出行分布规律得出居民出行高峰时段等,为司机提供依据,也为载客热
区的挖掘及出行需求预测提供基础。
2)载客热区挖掘。已有的研究侧重于居民出行轨迹方面。林基艳等
[5]
引入 DBSCAN
(density-based spatial clustering of applications with noise)算法确定出热点区域分布情况。
何月等
[6]
针对出租车空载率高的问题,采用基于网格的聚类算法,实现了载客热点区域的
挖掘。Tang 等
[7]
提出了 1 种混合路径尺寸对数模型(MPSL),并验证该模型可以分析出
租车司机的路线选择行为。Zheng 等
[8]
提出了 1 种基于网格密度的聚类算法,验证其算法的
有效性。王明
[9]
采用密度 DBSCAN 算法进行分析,发现热点区域挖掘结果的应用价值明显
提高。Luo 等
[10]
提出 1 种基于混合特征的密度测量方法,并对停靠点进行提取处理。桂智
明等
[11]
利用 DBSCAN 空间聚类算法确定出载客热区。王郑委
[12]
对相关的 K-means 聚类算
法设计,然后聚类分析了出租车载客点信息,确定出相应的热点区。
综上,针对出租车载客热区挖掘识别方面所采用的算法,现有研究多使用 K-means 和
传统的 DBSCAN 等,但 K-means 需要指定簇的个数,K 值难以确定。尽管 DBSCAN 聚类
算法不需要指定簇的个数,但参数的选择对聚类结果影响较大,因此研究引进 k-距离曲线
确定参数以改进 DBSCAN 聚类算法,提高聚类效果,使得分类更加精确。
3)出租车出行需求预测。Zhang 等
[13]
从复杂网络动力学的层面对出租车出行网络的复
杂度的日常动态演变进行了分析,并应用 BP 神经网络模型提高了出租车出行网络的管理
水平。王芮
[14]
通过网格划分法对出租车需求量进行估计,采用卡尔曼滤波算法、研究了目
标区出租车的出行需求。席殷飞等
[15]
对既有的出租车出行需求预测方法进行了分析,得出
国外预测分析要早于国内的结果,国内侧重于研究面向传统巡航式出租车的乘客需求热点
区域,而对网约车出行需求预测的定量分析较少。张文胜等
[16]
提出 1 种改进的灰狼算法优
化 BP 神经网络,提高了短时交通流预测的精度。叶秀秀等
[17]
采用多元线性回归算法预测
无检测器路段的交通流。Yang 等
[18]
提出了 1 种新的基于注意机制的端到端神经网络来预测
轨道交通客流,以提高预测效果。Wang 等
[19]
运用门控回归单元网络,对有效波高进行预
测,得出模型预报速度更快,适应性更强。李岩
[20]
采用了随机森林模型以及岭回归模型对
出租车的出行需求进行预测。
总结出行需求预测的现状可知,神经网络在预测中应用频率较高,性能较好,但现有
的出租车出行需求预测往往集中随机森林模型等基于统计分析或者非线性理论的模型,使
用神经网络预测较少,因此研究将 BP 神经网络应用到出行需求预测中,以提高出租车出
行需求预测的精度。
1. 出租车出行分布规律
1.1 数据处理
本文研究过程中的数据来源为滴滴平台。数据包括成都市 2016 年 11 月 1 日—30 日的
1 万多辆出租车的轨迹数据和订单数据。获取的每一行数据包括车辆的 ID,运行时间,订
单 ID,实时经纬度等。相关数据段见表 1。其中,轨迹 ID 字段为车辆编号;订单 ID 字段
为订单编号;GPS Longitude 和 GPS Latitude 为 GPS 记录的经纬度;GPS Time 字段为记录
采样时刻。
表 1 GPS 轨迹数据字段及含义
Table 1. Data fields and meanings of the GPS track
序号
字段
含义
1
轨迹 ID
编号
2
订单 ID
编号
3
GPS Longitude
经度
4
GPS Latitude
纬度
5
GPS Time
采样时刻
下载: 导出 CSV
| 显示表格
数据处理主要包括数据清洗、地图纠偏,以及出租车的上下客点提取。
1)数据清洗。GPS 数据采集过程中如果受到隧道和建筑物等障碍物的干扰、外界天
气及设备故障的影响,接收端返回的数据会存在噪声数据。因此应剔除不重复的、超出区
域的 GPS 数据。
2)地图纠偏。因坐标系选择的影响,获取的出租车轨迹往往会和实际路网相背离,
为了保证出租车空间分布的准确性,需要借助 ArcGIS 对部分偏离路网的轨迹数据修正。
3)上下客点提取。结合 GPS 轨迹数据和订单数据,提取出租车上下客点,图 1
(a)~(b)分别为某 1 个工作日的上下客点。
图 1 某工作日出租车上下客点
Figure 1. Taxi pick-up and drop-off points on a working day
下载: 全尺寸图片 幻灯片
1.2 出行需求时间分布规律
出行需求时间分布规律主要包含工作日与非工作日的出行需求分布规律,同一星期属
性的出行需求分布规律。
根据常识,工作日与非工作日出行需求分布规律存在一定的差异性,将数据分为周一
~周五、周六、周日这 3 组,因订单时长 15 min 左右的所占比例最大,所以按照 15 min 为
1 个时间间隔进行统计,将全天分为 96 个时间段,得到不同星期属性的出租车出行需求时
间变化规律,见图 2(a)。
剩余12页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3591
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功