第 xx卷 第 x期 控 制 与 决 策 Vol.xx No.x
xxxx年 x月 Control and Decision xxx. xxxx
文章编号: 1001-0920(0000)00-0000-00 DOI: 10.13195/j.kzyjc.2016.1401
一种回声状态网络的权值初始化方法
王 磊
†
, 乔俊飞, 李晓理
(1. 北京工业大学 信息学部,北京 100124;2. 计算智能与智能系统北京市重点实验室,北京 100124)
摘 要: 为了避免奇异解, 提高网络性能, 给出一种回声状态网络的权值初始化方法 (WIESN). 利用柯西不等式和
线性代数确定优化的初始权值的范围与输入维数、储备池维数、输入变量和储备池状态相关, 从而确保神经元的
输出位于 sigmoid 函数的激活区域. 实验结果表明, 权值初始化方法的精度和训练时间要优于随机初始化方法, 且
相比于训练时间,权值初始化的时间是可以忽略不计的.
关键词: 回声状态网络;奇异解;权值初始化;柯西不等式;线性代数
中图分类号: TP183 文献标志码: A
A weight initialization method for echo state network
WANG Lei
†
, QIAO Jun-fei, LI Xiao-li
(1. Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China;2. Beijing Key
Laboratory of Computational Intelligence and Intelligent System,Beijing 100124,China)
Abstract: To avoid singular problem and improve the performance of neural network, a weight initialization method
for echo state network(WIESN) is proposed. With Cauchy inequality and linear algebra, the range of optimal initial
weights, which is related to input dimension, reservoir dimension, input variables and reservoir state, is determined. The
proposed method ensures that the outputs of neurons are in the active region. Simulation results show that the accuracy
and training time of the proposed method is better than learning with random initialization. In addition, the time for
weight initialization process is negligible comparing with the training process.
Keywords: echo state network;abnormal solution;weight initialization;Cauchy inequality;linear algebra
0 引
神经网络可以看作是一个非线性系统, 它的训练
过程可以看作是非线性优化问题,目标是最小化误差
函数
[1-2]
. 对于神经网络,影响网络性能的主要因素有
网络结构、训练算法、激活函数、初始权值的选择
等
[3-4]
. 网络的性能(如训练时间、测试误差)部分程度
上依赖于变量的初始化,如在训练阶段网络权值的调
整
[5-8]
. 因此,有效的权值初始化技术对网络的训练非
常重要,权值初始化技术已经被广泛应用于前向神经
网络中,然而对于递归神经网络(如 ESN) 的权值初始
化的研究较少.
权值初始化的方法依赖于经验或神经元的特性,
定义优化的权值分布和范围,主要分为最小二乘方法
和区间分析方法两类. Thimm 等
[9]
用8 个基准问题对
这些方法进行了比对, 得到的结论是文献 [10]的方法
最为有效, 最小二乘方法能够计算出准确的初始权
值; Yam 等
[11]
提出了一种基于线性代数的权值初始
化方法,每层的优化初始权值通过最小二乘方法来估
计; Timotheou
[1]
给出了随机神经网络的权值初始化
方法, 利用非负约束逼近非线性方程得到线性方程,
然后利用投射梯度算法解决线性最小二乘问题, 结果
表明,有监督学习的初始化方法在解的质量和训练时
间上比随机初始化方法有显著的提升.
区间分析方法主要是确定优化的初始权值和
偏置的范围, 使得神经元处于 sigmoid 函数的激活区
域. Yam 等
[12]
给出了基于主成分分析的多层感知器
的权值初始化方法, 能够初始化隐含层的权值, 从输
入数据提取显著特征成分. 仿真结果表明, 相比于其
他初始化方法, 该方法能够显著减少训练时间, 有效
加速多层感知器的学习过程. Drago 等
[13]
通过统计
收稿日期: 2016-11-04;修回日期: 2017-02-13.
基金项目: 国家自然科学基金重点项目(61533002);国家杰出青年科学基金项目(61225016);国家自然科学基金面
上项目(61473034).
作者简介: 王磊(1980−) 男, 博士生, 从事神经网络和智能计算的研究;乔俊飞 (1968−), 男, 教授, 博士生导师, 从事
智能优化控制、污水处理过程控制等研究.
†
通讯作者. E-mail: jade_wanglei@163.com
网络出版时间:2017-09-04 11:05:48
网络出版地址:http://kns.cnki.net/kcms/detail/21.1124.TP.20170904.1105.009.html
评论0
最新资源