1. 数据预处理
在训练神经网络前一般需要对数据进行预处理,一种重要的预处理手段是
归一化处理。下面简要介绍归一化处理的原理与方法。
(1) 什么是归一化?
数据归一化,就是将数据映射到[0,1]或[-1,1]区间或更小的区间,比如
(0.1,0.9) 。
(2) 为什么要归一化处理?
<1>输入数据的单位不一样,有些数据的范围可能特别大,导致的结果是神经
网络收敛慢、训练时间长。
<2>数据范围大的输入在模式分类中的作用可能会偏大,而数据范围小的输入
作用就可能会偏小。
<3>由于神经网络输出层的激活函数的值域是有限制的,因此需要将网络训练
的目标数据映射到激活函数的值域。例如神经网络的输出层若采用 S 形激活函
数,由于 S 形函数的值域限制在(0,1),也就是说神经网络的输出只能限制在
(0,1),所以训练数据的输出就要归一化到[0,1]区间。
<4>S 形激活函数在(0,1)区间以外区域很平缓,区分度太小。例如 S 形函数
f(X)在参数 a=1 时,f(100)与 f(5)只相差 0.0067。
(3) 归一化算法
一种简单而快速的归一化算法是线性转换算法。线性转换算法常见有两种形
式:
<1>
y = ( x - min )/( max - min )
其中 min 为 x 的最小值,max 为 x 的最大值,输入向量为 x,归一化后的
输出向量为 y 。上式将数据归一化到 [ 0 , 1 ]区间,当激活函数采用 S 形函数
时(值域为(0,1))时这条式子适用。
<2>
y = 2 * ( x - min ) / ( max - min ) - 1
这条公式将数据归一化到 [ -1 , 1 ] 区间。当激活函数采用双极 S 形函数
(值域为(-1,1))时这条式子适用。
(4) Matlab 数据归一化处理函数
Matlab 中归一化处理数据可以采用 premnmx , postmnmx ,
tramnmx 这 3 个函数。
<1> premnmx
语法:[pn,minp,maxp,tn,mint,maxt] = premnmx(p,t)
参数:
pn: p 矩阵按行归一化后的矩阵
minp,maxp:p 矩阵每一行的最小值,最大值