论文研究-基于SVR对交通流中线性关联关系的分析与研究.pdf

所需积分/C币:6 2019-07-22 21:03:23 971KB .PDF

针对断面交通检测数据往往存在着错误、缺失、包含较多噪声等问题,提出了一种基于支持向量回归机的数据预处理方法。先将相邻路段的数据运用线性回归思想筛选、重组,添加到支持向量回归机的数据集中,然后对相邻路段与预测路段之间线性关系进行实时的、动态的分析和计算,从而避免了数据丢失,既有效地压缩了训练集特征数,提高了计算效率,也提高了模型的泛化能力。实验结果表明,对比未作预处理的SVR模型,改进后的模型拟合度提高了25倍,均方误差也明显减小。
第2期 曹来成,等:基于SVR对交通流中线性关联关系的分析与研究 421 高维特征空间构造最优决策函数;利用结构最小化原则,同时引及交叉口向东去的路段作为检測点,采集交叉口东去路段上和 入损失函数,并利用原空间的核函数取代高维特征空间的点积共他三路口的交通流数据,时间段为2012年3月8日15:00~ 运算,以避免复杂运算。因此,基于支持冋量回归的思路,结合15:30,时间间隔为2min,共14组数据。 本文提出的原始数据预处理方法,本文提出了以下预测模型 H软件是一套完整的数据处理、计算和制图软件系统,它 a)原始时间序列数据预处理,生成数据集并分组 提供了一些集成的统计工具和大量的数学计算、统计计算的函 某一路段在时刻讠所统计的交通流量、平均速度和车道占数从而使使用者能灵活杋动地进行数据分炘。将数据用R 有率分别记为(,;,ω1),F和O1分别为相邻路段对预测路段软件处理,得到交通流量的偏相关性分析数据如表1所示。 交通流量和占有率的预测值。则对于某一路段第i时刻的历 表1交通流量的分析数据 史数据x:=G1,"1,0,F:O:)与其预测对象的实测值y,即下 EsLitnale Std. Error I value Pr(>1I) 时刻的交通流量,可以构成样本点集合(x1,y)=1,l=N-2 2.589753.367010.769 0.4595 N为原样本总数。 1.393940.273975.0880.0004*: b)选择核函数,构造并求解最优化问题 0.964300.600616.051.8c-08* 得到数据集之后,选择径向基函数(RBF)作为核函数,包 0.440730.249701.765 0.10802 含宽度参数δ,二次规划的优化参数、C。E为不敏感损失图其中:e为截距l,sime为各变量的系数,*代表显著性 数即回归允许的最大误差,控制支持向量的个数和泛化能力,水平,***代表效果非常显著,按数月递减,没有星号代表回 其俏越大,攴持向量越小;C为惩罚变量,是函数回归模型的复归效果不显著。分析得到回归模犁的复相关系数 R-squarcd为 杂度和样本拟合精度之间的折中,其值越大则拟合精度越高。0.965,因此建立的模型中自变量与因变量总体的线性相关程 引入非负的松弛变量纟:和纟的最优化问题为 度显著,但从表1中可以看出截距和x3并不显著。 max∑y1(B1-B1)-s∑(B1+B1) 运用R软件中逐步回归计算函数step(),将x3去除后的 偏相关性分析数据如表2所示 (B;-B)(B;-B)K(x2,x) 表2去掉x3后的分析数据 s.t.∑(B:-B:)=0,0≤B,B1≤C Estimate Std. Error t valuc t|) 23222.913 0.014112款 式中:β,,分别为对应的 Lagrange乘子向量;xa、x;是不同时刻 1.405060.2990 4.698 的样本点集合;K(x,x1)=d(x1)·(x;)是满足 Mercer条件的 0.917930.0589715.5057.7-09*家事 核函数,本文选用径向基函数(RBF)。若B,、B,为式(7)的解 则可以构造顶测。 大除x3后的回归模型的复相关系数R- quare为0.9582 大于R010s(11)=0.5529。从表2屮可以看出,剩下的各变量 c)输入数据集,生成预测函数 构造预测函数(决策函数) 与因变量线性关系显著,并且各变量的标准差也邵减小了,表 示去掉x3的模型预测效果更加精确。此时,自变量x1、x2与因 f(x)=∑(B2-B2)K(x (8)变量y之间的回归效果显著,最终得到的回归模型为 偏置b的计算公式为 y=7.05898+1.40506x1+0.91793 剩余残差项;的期望为0,var(a2)=2.37 ∑(B-B)K(x2,x,),B,∈(0,C/) 将数据用R软件处理,得到占冇率的偏相关性分析数据 ∑(B-B)K( ,B∈(0,C/) 10)如表3所示 d)预测并进行误差分析 表3占有率的分析数据 输入当前时段及过去几个时段路段及上下游路段的交 Estimate Std. Error t value 通参数向量组合,利用预测函数f(x)就可以预测出下一时段 2.5l6 1.8536 1.358 0.204 的交通流量。本文将通过预测值的平均相对误差(MSE)和平 0.2954 0.2913 l.014 0.334 方相关系数K对预测结果进行误差分析,其中f(x2)为预测 0.8987 0.13386.7195.2e-05求 值,y:为实际值,为样本数。 -0.02230.20420.109 0.915 (a)平均相对误差 分析得到回归模型的复相关系数R- squared为0.8224,模 MSE=[2(x;)-Yi 型中自变量与因变量总体的线性相关程度较为显著。但从表 3中可以看出,只有自变量x2与因变量的线性关系显著,其他 (b)半方相关系数 变量与囚变量并没有线性关系。运用R软件中逐步回归计算 l∑:f(x1)y:-∑=1f(x2)∑1y;) 函数step(),将x1、x3去除后的分析数据如表4所示。 l∑=1f(x1)2-(∑=1f(x1))2)(E12-(∑{=y) 表4去掉1、x后的分析数据 平均相对误差是常用的预测结果评价指标,平方相关系数 Estimate Std. Error t value Pr(>|t1) 反映在因变量的总变差中由自变量变动所引起的百分比 (lntc)3.13570.88703.53 00411** 3仿真实验 0.9284 0.11298.2212.8e-06*幸 去除x1、x3后的回归模型的复相关系数R- quare为 3.1数据预处理 0.8367,大于R0(12)=0.532。从表4中可以看出,去掉x1 实验分析采用兰州市城关区庆阳路与酒泉路交叉∏处,以x3后,剩余变量与因交量之间的线性关系显著,标准差也明显 422 计算机应用研究 第32卷 减小,此时自变量x2与因变量y之间的回归效果显著,最终得 到的回归模型为 4结束语 y=3.1357+0.9284x2 本文根据预测路段上下游交通状况的内在联系建立了实 剩余残差项u1的期望为0,var(o2)=1.138。 时更新的线性回归模型,再通过该模型处理相邻路段交通流参 3.2支持向量回归机预测 数.对预测路段下一时段的交通流进行预测,将预测路段当前 本文采用了ε-SVR,核函数采用径向基核函数(RBF),通交通流参数与预测值合并,作为支持向量回归机的训练集和测 过已知薮据进行分组交叉验证,得到最佳的惩罚参数C和核试集数据。最后运用支持向量回归机进行训练、测试,并对误 函数参数γ。计算时利用Iin开发的 LIBSVM3.软件包。实差进行分析,可以看出本文提出的模型在精度方面有了很大的 验的硬件平台为CPU2.0GIl,内存1GB 提高,即使在大量的数据中本文的模型也可以准确、高效地计 本文分析运用了兰州市城关区某一交义口的若干检测器算出月标路段的预测值,避免了数据丢失和延时造成的影响。 采集的数据,数据统计间隔为5min。为了验证模型的有效性,但通过实验分析可以看到,模型仍存在需要改善的地方,如对 采用2012年3月7号(周三)5点到3月8号15点(共34个小相邻路段交通流屮冇在的非线性关联关系还需进一步研究,对 时)的数据进行分析,共47对数据将数据分为10组,前9组交通流量拐点处的预测还有待提高。 用于训练SVM,最后一组(3月8号11点-15点,共41对数参考文献: 据)数据用来测试交通流量预测的准确性。将预测路段三维[1 PEETA S, ZILIASKOPOULOS A K. Foundations of dynamic traffic 的交運状况数据归一化到[-1,1]区间,没有运用本文的方 assignment: the past, the present and the future[ J. Networks and 汏,直接通过支持向量回归机训练、测试,计算得到最佳的参数 Spatial Economics, 2001, 1(3): 233-265 值为c=0.0625,y=2,得到的效果图如图所示。 [2 KARLAFTIS M, VI.AHOGIANNI F. Statistieal methuds versus neural networks in transportation research: differences, similarities and some 运用本文提出的数据预处理方法,将预測路段上游交叉口 insights J. Transportation Research Part C: Emerging Technol 处的相邻路段交通流参数(x1,x2,x3)输入到建立好的线性回 oges,2011,19(3):387-399 归模型中,得到相邻路段对预测对象下一时段的交通流参数预31l1 Xing-yi,JNG)u+ba, SHI Hua-ji. Short-term tratic volumes fore 测值,即交通流量F和占有率O1,使训练集和测试集数据扩展 casting of road network based on nonparametric regression C1//Proe of the 7 th International Conference on Natural 为五维。为适应相邻路段之间关联关系的动态变化,数据预处 Washington DC: IEEE Computer Society, 2011: 228-231 理的计算间隔定为2min,即线性回归预测模型的计算间隔。[4] TSIRIGOTIS L, VLAHOGIAANIE I, KARLAFTIS M G. Does infor 将训练集和测试集数据归化到[-1,1]区间,计算得到最佳 mation on weather affect the performance of short-lerm traffic: forecas- 的参数值为c=0.3535,y=0.25,经过训练,得到的预测效果 ting models? LJ. International Journal of Intelligent Transporta tion Systems Research, 2012, 10(1): 1-10 图如图2所示。 [5 VLAHOGIANNI E I, KARLAFTIS M G. Comparing traffic flow time- series under fine and adverse weather conditions using recurrence based complexity measures[ J. Nonlinear Dynamics, 2012, 69(4) 1949-1963 叫120 120 [6 LEE Y S, TONG L I. Forecasting time series using a methodology based on autoregressive integrated moving average and genetic pro- gramming[ J_. Knowledge-Based Systems, 2011, 24(1): 66-72 051015202530354045 [7姚智胜,邵春福,熊志华,等.基于主成分分析和支持向量机的道 01020304050 时间序列个 时间序列个 路网短时交通流量预测LJ」.吉林大学学报:工学版,2008,38 图1未经数据处理的 图2经本文方法处理后的 SVR预测图 SVR预测图 [81 MIN Wan-lin, WYNTER L. Real-time road traffic prediction with 通过对比可以看到,采用本文的方法预测效果得到了明显 spatio-temporal correlations[ J 1. Transportation Research Part C Emerging Technologies, 2011, 19(4): 606-616 的改善。将测试集的数据进行误差分析其结果如表5所示。[9PANT, SUMALEE A, ZHONG R,ma. Short-term traffie state pre- 表5误差分析 diction based on temporal-spatial correlation[ J. IEEE Trans on In SVR MSE R-Squared telligent Transportation Systems, 2013, 14(3): 1242-1254 [10 ZIIANG Yang, WANG Meng-ling. Peak traffic forecasting using non- 未经数据处理的SVR 0.098226 0.009559 parametric approaches[I]. Journal of Shanghai Jiaotong Universi 经本文方法处理后的SVR0.0605470.256362 ty: Science,2012,17(1):76-81 本文提出的方法考虑了相邻路段对预测路段交通流的影 「I郭垸升,王文剑.动态粒度支持向量回归机「J.软件学报,2013 4(11):2535-2547 通过线性回归分析,仅保留了相关程度高的数据。经验证,[12]于滨,虾掰华,王明华,等,近邻短时交通流预测模型[J.文遥 该方法既降低了维度,又提高了数据的有效性,并且能够实时 运输工程学报,2012,12(2):105-11 地更新回归模型。在数据归一化的情况下,与原SVR比较,方[13]卢凯,徐建闽,郑淑鉴.相邻交又口关联度分析及其应用[冂].华 南理工 大学学报 然科学 法改进后的MSE有所减小,反块出改进后的预澳模型提高了14 ZENG Shao-hua, TANG Yuan-yuan,wEYm,ea. An algorithm 稳定性,减小了预测值和实际值的分散程度,从直观上看,改进 of detecting outliers in SVR[J]. International Journal of Wavelets 后模型的预測值与实际值比较接近。R- Squared反映了模型计 2012,3(10):1-23. 算的预测值与实际值的拟合程度,从分析中可以看出,对比未15150UAJ,NES,OH(EH, Assessing the relevance of load profi ling information in electrical load forecasting based on neural network 经数据处理的SVR预测效果,运用本文的方法处理后在拟合 models[ J]. International Journal of Electrical Power Energy 度方面提高了近25倍,拟合效果达到了模型预测所需的水平 Systems,2012,40(1):85-93.

...展开详情
img

关注 私信 TA的资源

上传资源赚积分,得勋章
相关内容推荐