论文研究-基于混合核函数SVM水文时序模型及其应用.pdf

所需积分/C币:22 2019-09-20 18:17:34 1.25MB .PDF
2
收藏 收藏
举报

论文研究-基于混合核函数SVM水文时序模型及其应用.pdf,  核函数的选取与构造是SVM应用的关键所在. 传统SVM在水文时序分析方面的应用多是默认选取单一径向基核函数,而忽略了核函数的选择对模型精度和预测结果的影响. 本文基于Mercer核理论,将多项式核与径向基核进行线性组合,构造出混合 核函数,并植入SVM中,对水文时序建立自回归预测模型. 基于武山站和南河川站的月径流预测结果表明,
第2期 唐奇,等:基于混合核函数SVM水文时序模型及其应月 523 22自回归模型(AR)定阶 通过平稳性检验后,进行AR模型定阶过程.首先计算序列的自协方差 k ∑(X;-X)(X+k 及样本的自相关系数 pk 和偏自相关系数 D 其中 1 X= D p1 pk-1 Pk 已知:pk和ok的渐近分布均为N(0,对于p和k仅需比较|pk和|k|与√×2的大小 假设存在ma和mma,满足 例V×2mh≤m;sVn×2mn≤h 这里只需找到最小的满足条件的ma,作为自回归SVM模型的阶数k即可27 23混合核函数构造 核函数将高维 Hilbert空间中两个点的内积运算,用原来输入空间中的两个模式的简单函数(核函数) 的求值来代替.通常使用的核函数有高斯径向基核、多项式核、傅里叶核等,其中:多项式核函数的形式为 K(x,x)=(x,xy)+c)2,c≥0,d=1,2,…,;c>0时为非齐次多项式核,c=0时上式则为齐次多项式核 五(x,x)=(x,x,d=1,2…高斯径向基核函数形式为K(x,x)=exp(-1xn),傅里叶核函数形式为 其中7各个Ym,∈R其中q是满足0<q<1的常数或A1(N 核函数的选择与先验知识有关.一般来说,运用SVM解决实际问题时通常选用高斯径向基核,这是由于 实际数据中大部分分布都可以认为近似服从高斯分布.理论上,不同核函数使得假设空间的大小和复杂度不 同,VC维则是对假设空间复杂性的一种度量28.径向基核函数属于典型的局部核函数,而多项式核函数则 是典型的全局核函数,仅当输入的X落入某个核函数的中心和宽度所定义的区域时,才会影响到核函数的 值.使用多项式核的SⅤM的VC维是有限的,但它会随着原始空间维数和多项式阶次的增加迅速地增加 对于使用径向基核的SVM,若宽度参数足够小,它能够将仟意大数目的训练点正确分类,因此可具有无限的 VC维.对亍一个模型来说,其性能好坏由学习能力和推广能力两方面所决定.全局核可以使相距很远的数 据点对核函数值都有影响,而局部核则使得只有相距很近的数据点才会对核函数值产生影响2 混合核函数是指将单一核函数进行组合得到的一种新的核函数.混合核函数的提出是基于对局部核函 数和全局核函数的一个综合考虑,可充分发挥二者的优势,弥补二者在应用上的不足.根据 Mercer核理论,可 知,在K3(6,6)是BmFn上的核的前提下,若m)为XCR到F的映射,则K(x,x)=K3((x),6(x′) 也是×F上的核;若∫()是定义在X∈F上的实值函数,则K(x2)=f(x)f(x)是正定核.若 K1和K2是F×F上的核,则K(x,)=K1(x,x′)+K2(x,x),K(m,x)=aK1(x,m)及F(x,)= K1(x,x′)K2(x,x)均是核.特别地,若p(x)是系数全为正数的多项式,则K(x,x)=p(K1(x,x3)、K(x,x) exp(K1(x,x)及K(x,x)=eXp(-l2)均为核 综上所述,以下函数亦为核函数 K(,C=(1-p)exp +p(x,x2)+c)2,0<p<1 2 524 系统工程理论与实践 第34卷 在此函数中,p值决定了单一核函数在混合核函数中所占的比重.当p>0.5时,多项式核函数占主导地 位:当ρ<0.5时,径向基核函数起主要作用;当ρ=0.5时,两种核函数重要程度相当.因此,在构造混合核 函数中,可通过调节ρ值米实现径向基核函数和多项式核函数的灵活组合.如上构造的混合函数既可实现径 向基核函数在拟合优度上的优势,又可发挥多项式核函数在推广性能上的长处 2.4基于混合核函数SⅴM自回归水文时序模型建立 回归模型描述如下:已知训练集T={(x1,1),…,(x,y)}∈(X×Y),其中x;∈X=F为输入向量 v∈Y=R为输出指标,=1,2,…,l.寻找Pn上的一个实值函数f(x),使得y=f(x)可用于来推断任 x所对应的y值.基于SVM的回归模型原理如下:将原始空间中的数据进行变换,映射到一个高维特征空 间去而后进行线性估计.具体来说,即在高维特征空间中构造最优决策函数f(x)=1·p(x)+b.其中o(x) 为将输入变量映到高维空间的变换函数,ω为权重向量,b为偏置.由最优化理论可知,上述问题等价于 mQ0(m,(a)+) (11) 其中L为损失函数.由于只有ε-不敏感损失函数才能使得到的支持向量具有稀疏性、因此L选用ε-不敏 感损失函数 定义ε-不敏感损失函数为 基于混合核函数支持向量机自回归的水文时序模型 当1y-f(x)|≤ε时 1y-f(al= y-f(x)-c,其它 降水时间序列 核函数选取 引入松弛变量ξ;和ξ,上述最优化问题等价于 季节差分 基于径向基核和多项 min R(w, b) ∑(51+5 平稳性检验~Y 式核构造混合核凶数 222+C ¢(x)-b≤ε+ 差分 调节混合核函数参数 sur:a(xz)+b-3≤e+ 5≥0,5≥0 模型定阶 这里输入向量为水文时序x1,x2,…,xk,k为阶数; 确定阶数 输出向量为 综上所述,基于混合核函数SVM自回归的水文 时序模型的建立与计算步骤如图1所示 确定损失函数及惩罚因子 3应用分析 完成支持向量回归模型建立 31数据来源 图1基于混合核函数SvM自回归水文时序模型计算流程 武山站和南河川站均处于渭河上游,渭河上游年降水量一般为300~500mm.其中,武山站位于甘肃省武 山县城关北,东经104°53′,北纬34°44′,建于1974年7月,集水面积8080km2,是渭河最上游的测站,属于 国家二级水文站;南河川站位于甘肃省天水县南河川公社刘家庄,东经105°45′,北纬34°37,建于1944年7 月,集水面积2385km2,距离河口58km30,选取渭河武山站及南河川站1956年-1990年间月平均径流 量为研究对象.考虑到原始数据为月径流数据,因此先做去周期化处理,即令y=x4+12-x·由于数据源自 于一个变量的时间序列,所以无需对数据进行标准化处理 武山站月平均流量 时间月 图219561990年武山站月径流量变化 第2期 唐奇,等:基于混合核函数SVM水文时序模型及其应月 525 去掉季节变化 150 100 150 200 400 时间(月) 图3去掉季节变化后武山站月径流量变化 南河川站月平均流量 250 450 图41956-1989年南河川站月径流量变化 去掉季节变化 据 100 350 时间月) 图5去掉季节变化后南河川站月径流量变化 由图2~图5可知,去掉季节变化后,月径流数据的折线图中高值数据波动不再明显.整个数据基本趋 于平稳,这对后期建模是必要的 32预测过程及结果分析 32.1平稳性检验 用计量经济学软件 eviews进行ADF检验结果如表1和表2所示 表1武山站月径流量序列ADF检验结果 表2南河川月径流量序列ADF检验结果 零假设:Y存在单位根 零假设:Y存在单位根 t统计量 概率 t统计量 概率 ADF检验统计量6.2298980.0000 ADF检验统计量 10.09349 0.0000 检验临昇值: -3.453997 检验临界值: -3.116281 2871845 5% 2.868457 10%2.572334 10% 2.570520 判定系数 0.410733因变量均值 0.000764判定系数 0254968因变量均值 0.003457 校正判定系数0.381382因变量标准差 2277644校判定系数0249394因变量标准差 42.06330 回归标准误差1791419赤池信息量(AIC)8.658631回归标准误差36.44260赤池信息量(AIC)10.03918 残差平方和 8375966施瓦兹信息量(SC)8.842757残差平方和5325533施瓦兹信息量(SC)10.07873 对数似然比 117656F统计量 1399406对数似然比 2028934F统计量 45.74394 DW统计量 201562P(F统计量) 0000DW统计量 2032517P(F统计量) 0.000 526 系统工程理论与实践 第34卷 可知,ADF的统计量分别为-6.229898和-10.09349,远小于在1%置信水平下的临界值-3453997和 3446281,这说明实验选取的水文时序是平稳的(见表1、表2) 322定阶分析 计算样本如下 表3武山站月径流量序列自相关及偏自相关系数 自相关系数(AC)偏自相关系数(PAC) AC PAC G统计量概率 冰*米 水*米 0.52 0.52 78.7820.00 0.3340.087111.450.00 0.1980.008122.970.00 0.122 127.340.00 0.0940.027129.930.00 0.0470.024130.570.00 0.0070.029130.590.00 0.0140.027130.650.00 0.0330.058130.99 0.00 表4南河川站月径流量序列自相关及偏自相关系数 百相关系数(AC)偏自相关系数(PAC) AC PAC Q统计量概率 木木木本 木本木木 0.5420.542120.730.00 0.3180.034162.370.00 0.0570.18116:3.720.00 0.089-0.092167.030.00 ).172-0.062179.270.00 0.063 196.09 0.00 0.1880.044210.840.00 0.1140.024216.290 0.0020.079 216.290.00 由表3及表4可看出,序列自相关系数呈哀减正弦波,并趋向于0,表现为拖尾性;在偏自相关分析图中, 滞后1期的偏自相关系数明显不为0,而p>2以后的值都在随机区问以内,可以认为序列的偏自相关函数 具有截尾性.因此,建立AR(p)模型,阶数p由显著不为0的偏自相关系数的数目决定,这里阶数p=1. 323预测结果及检验分析 分别采用多项式核函数、径向基核函数及混合核函数对月平均流量进行预测,其中,前24年为训练样 本,余者为测试样本.拟合结果如图6~图11所示 图中实线表示观测值,虚线表示模型得到的预测值.由于拟合图只能给出直观的认识,无法定量说明预 测结果的好坏,因此采用相对误差(RE)和均方误差(MSE)作为回归结果评价标准进行衡量.其中,RE(t) 2D7,()为实测值,y()为预测值;MSE=∑h=1(r-m),其中和正:分别表示预测值和实测 值.相对误差越小,均方误差越小,表明预测性能越好;反之则预测性能越差 径向基核函数预测图 多项式核函数预测图 多项式核函数 实际数据 径向基核数 实际数据 60 时间(月) 时间(月) 图6武山站月径流量预测(径向基核) 图7武山站月径流量预测(多项式核) 第2期 唐奇,等:基于混合核函数SVM水文时序模型及其应月 527 混合核函数预测图 径向基核函数预测图 160 -混合核函数 径向基核函数 实际数据 140 实际数据 100 80 时间(月) 时间(月) 图8武山站月径流量预测(混合核) 图9南河川站月径流量预测(径向基核) 多项式核两数预测图 混合核函数预测图 多项式核函数 混合核函数 140 实际数据 140 实际数据 20 0 时间(月) 时间(月) 图10南河川站月径流量预测(多项式核) 图11南河川站月径流量预测(混合核) 统计结果如表5~6 表5武山站结果预测 多项式核函数径向基核函数 混合核函数 p=0.9P=0.91P=0.95p=0.96 RE 0.604 0.6l1 0.457 0.450 0.43 0.430 MSE 19048 19.299 16.680 15846 15.804 15822 表6南河川站结果预测 多项式核函数径向基核函数 混合核函数 p=0.9p=0.91p=0.94p=0.96 RE 0.626 0.686 0.504 0.488 0.453 0.406 MSE 32.0916 32.5273 30.40630.078 28.636 29.356 参数ρ用来调整多项式核函数和径向基核函数的比重通过武山站及南河川站两个实例可看出,在系数 ρ=0.:96时,模型预测结果的相对误差最小,p=0.95和p=0.94时均方误差分別取得最小值;p>0.9时, 混合核函数的预测精度优于任一单一核函数.由此看出,本文所设计的混合核函数结合」径向基核函数和多 项式核函数的优点,在拟合优度及预测方面貝有明显的优势 4结论与讨论 SVM的关键在于核函数的选取与构造.全局核具有较好的外推能力,而局部核则有较好的插值能力.本 文建立基于混合核函数的SVM自回归模型,利用武山站和南河川站1956至1990年月径流量数据进行了应 用分析.结果表明,相比单一的径向基或多项式核函数,基于混合核函数构造的SⅥM预测结果,无论在相对 误差、均方误差及拟合优度等方面均具有明显的改进.对于水文时序,在没有关于哪个核是最适核的先验信 528 系统工程理论与实践 第34卷 息时,对单一核函数进行组合,构造混合核函数扩大学习方法的搜索空间,无疑是一种有效的改进.本文所用 核函数是多项式核及径向基核的组合,今后可对其他核函数的不同组合开展深入的研究 参考文献 1 Wang H R, Ye L, Liu CM, et aL. Problems in wavelet analysis of hydrologic series and some suggest ions on improvement[J. Progress in Natural Science, 2007, 17(1):80-86 2]桑燕芳,王栋.水文时间序列周期识别的新思路与两科新方法[J].水科学进展,2008,19(3):412-417. Sang Yanfang, Wang Dong. New idea and two new methods for identifying periodicities of hydrological time seriesJ. Advances in Water Science, 2008, 193):412 417 阝3]王红琉,康健,林欣,等.水文序列 ARIMA模型应用中存在的问题与改进方式J.系统工程理论与实践,2008,28(10) 166-176. Wang Ilongrui, Kang Jian, Lin Xin, et al. Problems existing in ARIMA model of hydrologic series and some improvement suggestions J. Systems Engineering- Theory Practice, 2008, 28(10): 166-176 「李向阳,程春田,林剑艺基于BP神经网络的贝叶斯概率水文预报模型.水利学报,2006,37(3):354359 Li Xiangyang, Cheng Chuntian, Lin Jianyi. Bayesian probabilistic forecasting model based on BP ANNJ Journal of Hydraulic Engineering, 2006, 37 (3): 354-359 5]庞博,郭生练,熊立华,等改进的人工神经网络水文预报模型及应用J武汉大学学报:工学板,2007,40(1):3341. Pang Bo, guo Shenglian, Xiong Lihua, et al. A Imodified artificial neural network Inodel and its application to food forecasting J]. Fngineering Journal of Wuhan University, 2007, 40(1):3341 6 Yang X Il, Mei Y, She DX, et al. Chaotic Bayesian optimal prediction method and its application in hydrological time series[J. Computers and Mathematics with Applications, 2011, 61: 1975-1978 [7 Yoon H, Jun S C, Hyun Y, ct al. A comparative study of artificial neural nctworks and support vector machines for predicting groundwater levels in a coastal aquiferJ. Journal of Hydrology, 2011(1):128-1 8 Tripathi S, Srinivas VV, Nanjundiah R S. Downscaling of precipitation for climate change scenarios: A support vector machine approachJ. Journal of Hydrology, 2006, 3303):621 640 ⑨]黄明聪,解建仓,阮本清,等基于支持向量机的水资源短缺风险评价模型及应用凹.水利学报,2007,38(3):255-259. Huang Mingcong, Xie Jiancang, Ruan Benqing, et al. Model for assessing water shortage risk based on support vector machineJ]. Journal of Ily draulic Engineering, 2007, 38(3):255-259 10 Wang W C, Chau K W, Cheng CT, et al. A comparison of performance of several artificial intelligence methods for forecasting monthly discharge timc scrics J. Journal of Hydrology, 2009 (3): 294-306 11 Kisi O, Cimen M. A wavelet-support vector machine conjunction model for monthly streamflow forecasting J Journal of Hydrology, 2011(1): 132-140 12]王红瑞,刘晓红,唐奇,等基于小波变换的支持向量机水文过程预测[J].清华大学学报:自然科学版.2010,50(9):1378 Wang Hongrui, Liu Xiaohong, Tang Qi, et al. Prediction of hydrological series based on wavelet transform and support vector machine[J. Journal of Tsinghua University: Sci Tech, 2010, 50(9): 1378-1382 13 Noori R, Karbassi A R. Moghaddamnia A, et al. Assessment of input variables determination on the sVM model performance using PCA, Gamma test, and forward sclcction techniques for monthly strcam flow prcdictionJ Journal of Hydrology, 2011(3): 177-189 14张楠,夏自强,江红.基于多因子量化指祘的支持向量机径流预测J].水利学报,2010,40(11):1318-1324 Zhang Nan, Xia Ziqiang, Jiang Hong. Prediction of runoff based on the multiple quantity index of SVMJ Journal of hydraulic er 2010.40(11):1318-1324 15]于国荣,夏白强.支持向量机的混沌序列预测模型及在径流中应用[J.水利学报,2007(增刊:455-160. Yu guorong, Xia Ziqiang. The prediction model of chaotic series based on support vector machine and its application to runoff[J] Journal of Hydraulic Engineering, 2007(S):455-460 16〗于囯荣,夏自强.混沌时间序列支持向量机模型及其在径流预测中应用.水科学进展,2008,19(1):11612 Yu guorong, Xia Zigiallg. Prediction Illodel of chaotic timle series based on support vector Inachine and its application to runoff J. Advances in Water Science, 2008, 19(1):116-122 17]林剑艺,程春田.支持向量机在中长期径流预报中的应用同J].水利学报,2006,37(6):681-686. Lin Jianyi, Cheng Chuntian. Application of support vector machine method to long-term runoff forecast J Journal of Hydraulic Engineering, 2006. 37(6): 681-686 18 Lin G F, Chen G R, Huang P Y, et al. Support vector Inachine-based nodels for hourly reservoir inflow forecasting during typhoon-warning periods[J. Journal of Hydrology, 2009 (1):17-29 19 Chen S T, Yu P S, Tang Y H. Statistical downscaling of daily precipitation using support vector machines and Inlultivariate analysis J]. Journal of Hydrology, 2010(1): 13-22 第2期 唐奇,等:基于混合核函数SVM水文时序模型及其应月 529 20]周秀平,王文圣,黄伟军支持向量机回归模型在径流预测中的应用J].水电能源科学,2006,24(4):46. Zhou Xiuping, Wang Wensheng, Huang Weijun. Application of support vector machine regression in runoff forecasJ. Water Resources and Power, 2006, 24(4):4-6 2】]廖杰,王文圣,李跃清,等.支持向量机及其在径流预测中的应用J.四川大学学报:工程科学版,2006,38(6):24-28 Liao Jie, Wang Wensheng, Li Yueqing, et al. Support vector machine method and its application to prediction of runoff. Journal of Sichuan University: Engineering Science Edition, 2006, 38(6): 24-28 22汪丽娜,李粤安,陈晓宏.基于支持向量机的降雨-径流预测研究门.水文,2009,29(1):13-16 Wang Lina, Li Yuean, Chen Xiaohong. Prediction of rainfall-runoff based on support vector machine methodJ Journal of China Hydrology, 2009, 29(1): 13-16 23李彦彬,黄强,徐建新,等.基于混沌支持向量机的河川径流预测矸究[水力发电学报,200827(6):4247 Li Yanbin, Huang Qiang, Xu Jianxin, et al. Research on prediction of streamflow based on C-SVMJ. Journal of Ilydroelectric Engineering, 2008, 27(6):42-47 24 Yu X Y, Liong S Y. Forecasting of hydrologic time series with ridge regression in feature space]. Journal of Hydrology,207(3):290302 25]李庆国,陈守煜.基于模糊模式讥别的支持向量机的回归预测方法[J.水科学进展,2005,16(5):741-746. Li Qingguo, Chen Shouyu. A SVM regress forecasting method based on the fuzzy recognition theoryJ]. Advances in Water Science, 2005, 16(5): 741-746 126]王红瑞,冯启磊,林欣,等基于FRCM和HLAR的水文过程遍历特征分析模型及其应用J.中国科学E辑:技术科 学,2008,38(11):1984-1994 Wang Hongrui, Feng Qilei, Lin Xin, et al. Development and application of ergodicity model with FRCM and FLAR for hydrological process[J. Science China Technological Sciences, 2009, 52(2 : 379-386 27]任海军,孙瑞志,刘广利.基于 AR SVR模型的吋间序列预测算法的研究[J.计算机工程与设计,2010,31(2):421-424 Ren Haijun, Sun Ruizhi, Liu Guangli. Research of time-series forecasting algorithm based on AR-SVR modelJ Computer Engineering and Design, 2010. 31(2):421-424 28 ESmith G, Jordaan E Improve SVM regression using mixtures of kernels[Cl// Proceedings of IEEE Interna tional Joint Conference on Neural Networks. USA. 2002 2785-2790 29张拥华.基于支持向量机的金融时间序列研究[D]长沙:湖南大学,2008 Zhang Yonghua. Financial time scrics rescarching bascd on support vector machine D]. Changsha: Hunan University, 2008 30水利电力部黄河水利委员会.1980年黄河流域水文资料第7册,泾洛谓区(渭河水系)M].开封:水利电力部黄河水利委 员会,1982 31 Jiang G P, ZhengWX. A simple method of chaos control for a class of chaotic discrete-time systems J. Chaos, Solitons Fractals, 2005, 23(3 ): 843-849 32 Chick S, Shortle J, Gelder P V, et al. A model for the frequency of extreme river levels based on river dynamicsJ Structural Safcty, 1996, 18(4):261-276 33 Cline D B H, Pu HH. Verifying irreducibility and continuity of a nonlinear time seriesJ. Statistics Probability Letters,l998,40:139-148

...展开详情
试读 9P 论文研究-基于混合核函数SVM水文时序模型及其应用.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
抢沙发
一个资源只可评论一次,评论内容不能少于5个字
weixin_38744153 欢迎大家使用并留下宝贵意见
2019-09-20
  • 至尊王者

    成功上传501个资源即可获取
关注 私信 TA的资源
上传资源赚积分or赚钱
    最新推荐
    论文研究-基于混合核函数SVM水文时序模型及其应用.pdf 22积分/C币 立即下载
    1/9
    论文研究-基于混合核函数SVM水文时序模型及其应用.pdf第1页
    论文研究-基于混合核函数SVM水文时序模型及其应用.pdf第2页

    试读结束, 可继续读1页

    22积分/C币 立即下载 >