没有合适的资源?快使用搜索试试~ 我知道了~
B001-李正-基于时间序列模型的铁路旅客流量预测.pdf
需积分: 5 0 下载量 112 浏览量
2023-12-11
21:46:30
上传
评论
收藏 2.75MB PDF 举报
温馨提示
试读
27页
B001-李正-基于时间序列模型的铁路旅客流量预测.pdfB001-李正-基于时间序列模型的铁路旅客流量预测.pdf
资源推荐
资源详情
资源评论
第四届“泰迪杯”
全 国 数 据 挖 掘 挑 战 赛
优
秀
作
品
作品名称:基于时间序列模型的铁路旅客流量预测
荣获奖项:特等并获企业冠名奖
作品单位:中国计量大学
作品成员:李正 沈烨平 朱慧慧
指导老师:王义康
第四届“泰迪杯”全国数据挖掘挑战赛 www.tipdm.org
第
1
页
基于时间序列模型的铁路旅客流量预测
摘要:本文旨在研究铁路旅客流量预测问题,通过对数据的挖掘,多维度的分析客
流规律,建立客流规律预测模型并优化车辆配置及车辆停靠方案。
本文通过运用 eclipse,mySQL 等软件建立了列车到站离站信息数据库,包括列车表,
站点表,到站离站表和区间表等常用表。用 matlab 结合 mySQL 对旅客梯形密度表中的
数据从车次、时段、车站和区间四个角度进行了分类处理。综合考虑各车次的客座率,
客流流入区间波动情况,每日的客流高峰时段,站点等级和客流流向,多维度的分析客
流规律。针对站点,运用改造的
RFM
模型对各个站点分区;针对区间,从三个角度—
—ZD111-01
ZD190-01 的本地客流(管内上行)、ZD190-01
ZD111-01(下行)的本
地客流和 ZD111-01
ZD190-01 的外地客流分析客流流向趋势。
其次,本文建立考虑季节特征的 SARIMAX 模型对未来客流进行了预测,但是节假
日效应对预测误差影响明显。基于数据的分析,我们发现节假日的预测误差在期间以三
角函数波形波动,我们采用傅立叶函数系对节假日误差段进行三阶拟合,拟合优度都在
75%
以上。同时结合预测值与实际值线性变化的性质,对前一年节日误差段进行当前年
份的校正,并用 15 年春节数据对 16 年春节校正并检验,效果显著。这足以证明这种基
于傅立叶拟合的节假日误差修正技术适合于消除 SARIMAX 模型所不能规避的节假日
效应。
同时考虑天气的影响,发现天气虽然会影响客流量,但是对预测误差影响不明显,
我们认为这是由于 SARIMAX 模型已经在客流量数据变化的角度解释了这种现象。
基于这两种情况的分析,给出了未来两周各搭乘区间客流量的预测。
最后,建立多阶段决策的调度模型。考虑到管内车客座率分配不均会导致高峰期列
车资源的严重浪费的情况,兼顾模型求解的复杂性,建立了以日客座率各车次平均分配
为目标的 0-1 规划模型。用 lingo 分支定界得到各车次不同日期的停靠站点的局部最优
分配方案,同时对比节假日(高峰期)和工作日(低谷期)分配方案,得到常驻站点和
可变站点的设置方案。此外,结合客流规律的分析,采用贪婪算法,对编组方案进行了
优化设计。具体如下:取消 D11 和 D18 班次的 ZD250 站点;D16 增开 ZD062 站点;D05,
D06,D07
和
D16
增开
ZD190-02
站点;
D05
车次由
16
组编组改成
8
组编组。
关键词:改造的 RFM 模型 SARIMAX 预测模型 傅里叶拟合 0-1 规划 贪婪算法
第四届“泰迪杯”全国数据挖掘挑战赛 www.tipdm.org
第
2
页
The thesis title
Abstract: This paper aims to study the prediction of railway passenger traffic. A new
model for predicting railway passenger flow based on data mining and multidimensional
analysis of passenger data has been proposed. Furthermore, guiding by the established system,
the railway train operation plan has been optimized.
Current passenger data are analyzed by trips, time, stations and section by using Java,
eclipse and mySQL. Firstly, the rule of passenger volume is multi-dimensional evaluated by
passenger load factors of all train number, fluctuations of passenger flow into the section, the
daily flow peak hours of passengers, site rating and traffic flow, analysis of traffic laws. RFM
model was used for optimization of the stations, while the passenger volume for each section
was diagnosed by three special cases, e.g. local passenger volume between ZD111-01and
ZD190-01, local passenger volume between ZD190-01 and ZD111-01 and foreign passenger
volume between ZD111-01 and ZD190-01.
Secondly, prediction model of SARIMAX was set up to forecast the future passenger
flow. Besides, compared to the effect of weather, the influence of holidays was found to be
more obvious, which is modified by using Fourier fit in the model, while the effect of weather
is ignored in the model.
Lastly, multi-stage scheduling decision model was built to optimize the railway train
operation plan. However, in consideration of the complexity of the model solution, the model
was simplified to the 0-1 programming problem of mean distribution of daily load factor trips.
Then, combined with rule of passenger volume, the optimization of the railway train
operation plan was achieved by using greedy algorithm. Particularly, D11 and D18 in ZD250
is cancelled; station ZD062 is added to D16; station ZD190-02 is added to D05, D06, D07
and D16; D05 is changed from 16-grouped to 8-grouped.
Key words: RFM model,SARIMAX model,Fourier fit,0-1programming,greedy algorithm
第四届“泰迪杯”全国数据挖掘挑战赛 www.tipdm.org
第
3
页
目录
1. 挖掘目标................................................................................................... 4
2. 分析方法与过程....................................................................................... 4
2.1. 总体流程............................................................................................................................4
2.2. 具体步骤............................................................................................................................5
2.3. 结果分析..........................................................................................................................25
3. 结论......................................................................................................... 26
4.
参考文献
................................................................................................. 26
第四届“泰迪杯”全国数据挖掘挑战赛 www.tipdm.org
第
4
页
1. 挖掘目标
本次建模利用铁路系统中积累下来的海量真实数据,采用数据挖掘技术,达到以下
三个目标:
(1)
按车次、时段
(
小时
)
、车站、区间
(
两个车站之间
)
等条件分析客流规律。
(2)
考虑节假日和天气等相关因素的影响,从管内和管外客流两个角度,建立时间序
列预测模型,并预测未来两周的客流量。
(3)针对 D02-D19 车次的列车,优化设计车辆配置及车站停靠方案。
2. 分析方法与过程
2.1. 总体流程
本用例主要包括如下步骤:
步骤一:铁路系统数据和气象系统数据的分类采集是本次数据挖掘分析的第一步。
运用
Java
,
eclipse
和
mySQL
等软件,对旅客列车梯形密度信息进行车次信息,时段信
息,车站信息和区间信息的挖掘。同时对所统计的地区气象信息进行天气状况,温度状
况和风速信息的挖掘。
步骤二:数据预处理,考虑到直接采集的部分数据并不能直接拿来进行分析,通过
运用相关的模型和数学分析,有针对性的处理数据,得出需要的信息。
步骤三:数据分析:针对车次信息,在考虑管内车还是管外车的情况下分析该车在
区间内的客座率。对管外车进一步分析客流流入区间的情况。针对时段信息,分析一天
内站点的客流变化情况。针对车站信息,运用改进的
RFM
模型来衡量站点价值。针对
区间信息,观测两站点区间内客流量,分析乘客的流动规律。
步骤四:根据步骤三中数据分析得出的客流规律,将列车分为管内车和管外车,综
合考虑天气和节假日的影响因素,建立 SARMAX 时间序列预测客流量模型,并进一步
的运用该模型来预测未来两周的客流规律。
步骤五:根据前面分析的客流规律,针对 D02-D19 车次的列车,设计基于 0-1 规划
剩余26页未读,继续阅读
资源评论
matlab科研助手
- 粉丝: 1w+
- 资源: 2054
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功