没有合适的资源?快使用搜索试试~ 我知道了~
经验正交函数分析方法(EOF分析)
4星 · 超过85%的资源 需积分: 41 109 下载量 124 浏览量
2014-08-27
10:30:21
上传
评论 1
收藏 683KB PDF 举报
温馨提示
试读
14页
经验正交函数分析方法(empirical orthogonal function, 缩写为EOF),也称特征向量分析(eigenvector analysis),或者主成分分析(principal component analysis,缩写PCA),是一种分析矩阵数据中的结构特征,提取主要数据特征量的一种方法。
资源推荐
资源详情
资源评论
A.7 EOF分分分析析析
经验正交函数分析方法(empirical orthogonal function, 缩写为EOF),也称特征
向量分析(eigenvector analysis),或者主成分分析(principal component analysis,缩
写PCA),是一种分析矩阵数据中的结构特征,提取主要数据特征量的一种方
法。Lorenz在1950年代首次将其引入气象和气候研究,现在在地学及其他学科中
得到了非常广泛的应用。地学数据分析中通常特征向量对应的是空间样本,所以
也称空间特征向量或者空间模态;主成分对应的是时间变化,也称时间系数。因
此地学中也将EOF分析称为时空分解。
原原原理理理与与与算算算法法法
• 选定要分析的数据,进行数据预处理,通常处理成距平的形式。得到一个数
据矩阵X
m×n
• 计算X与其转置矩阵X
T
的交叉积,得到方阵
C
m×m
=
1
n
X × X
T
如果X是已经处理成了距平的话,则C称为协方差阵;如果X已经标准
化(即C中每行数据的平均值为0,标准差为1),则C称为相关系数阵
• 计算方阵C的特征根(λ
1,...,m
)和特征向量V
m×m
,二者满足
C
m×m
× V
m×m
= V
m×m
× ∧
m×m
其中∧是m × m维对角阵,即
∧ =
λ
1
0 . . . 0
0 λ
2
. . . 0
. . . . . . . . . . . .
0 0 . . . λ
m
一般将特 征根λ按从大到小顺序排列, 即λ
1
> λ
2
> . . . > λ
m
。因为数
据X是真实的观测值,所以λ应该大于或者等于0。每个非0的特征根对应
42
一列特征向量值,也称EOF。如λ
1
对应的特征向量值称第一个EOF模态,
也就是V 的第一列即EOF
1
= V (:, 1);第λ
k
对应的特征向量是V 的第k列,
即EOF
k
= V (:, k)。
• 计算主成分。将EOF投影到原始资料矩阵X上,就得到所有空间特征向量对
应的时间系数(即主成分),即
P C
m×n
= V
T
m×m
× X
m×n
其中P C中每行数据就是对应每个特征向量的时间系数。第一行PC(1,:)就是
第一个EOF的时间系数,其他类推。
上面是对数据矩阵X进行计算得到的EOF和主成分(PC),因此利用EOF和PC也
可以完全恢复原来的数据矩阵X,即
X = EOF × P C
有时可以用前面最突出的几个EOF模态就可以拟合出矩阵X的主要特征。此
外,EOF和PC都具有正交性的特点,可以证明
1
n
P C × P C
T
= ∧;即不同的PC之
间相关为0。E × E
T
= I。I为对角单位矩阵,即对角线上值为1,其他元素都
为0。这表明各个模态之间相关为0,是独立的。
由上面的计算过程可以看出,EOF分析的核心是计算矩阵C的特征根和特征向
量。计算矩阵特征根和特征向量的方法很多,下面具体给出Matlab中进行EOF分
析的两种不同的方法。具体步骤可参考下面两个框图中的实例。
方法1:调用[EOF,E]=eig(C),其中EOF为计算得到的空间特征向量,E为特
征根。然后计算主成分P C = EOF
T
× X。需要指出的时,当数据量很大时,例
如分析高分辨率的资料(如1km分辨率的NDVI资料),空间范围很大维数m很容易
超过数万个点,则矩阵C的维数是个巨大量,需要占用大量内存,也会导致计算
速度异常缓慢。而且很可能超出计算机的计算极限而死机。
方法2:直接对矩阵X进行奇异值分解
X = U
X
V
T
其中
P
为奇异值对交阵(
P
对角线上的元素为奇异值),奇异值与特征根成倍数关
系。
43
• 如果矩阵C =
1
n
XX
T
,C的特征根为λ,则有
P
=
√
nλ;
• 如果矩阵C = XX
T
,C的特征根为λ,则有
P
=
√
λ;
由于该方法是直接对矩阵X进行分解,所以对内存的要求远小于方法1。计算速度
很快。
两种方法对比练习。
显显显著著著性性性检检检验验验
可以证明
m
X
i=1
X
2
i
=
m
X
k=1
λ
k
=
m
X
k=1
P C
2
k
这说明矩阵X的方差大小可以简单的用特征根的大小来表示。λ越高说明其对应的
模态越重要,对总方差的贡献越大。第k个模态对总的方差解释率为
λ
k
P
m
i=1
λ
i
× 100%
即使是随机数或者虚假数据,放在一起进行EOF分析,也可以将其分解成一
系列的空间特征向量和主成分。因此,实际资料分析中得到的空间模态是否是随
机的,需要进行统计检验。North等(1982)的研究指出,在95%置信度水平下的特
征根的误差
∆λ = λ
r
2
N
∗
λ是特征根,N
∗
是数据的有效自由度,这在前面相关系数分析中已经有介绍(见4
页相关内容)。将λ按顺序依次检查,标上误差范围。如果前后两个λ之间误差范围
有重叠,那么他们之间没有显著差别。
图A.16是对1949 − 2002年北半球1月平均海平面气压,做距平处理处理及面积
加权后进行EOF分析的结果。从特征根误差范围看,第一和第二模态存在显著差
别,第二和第三模态之间也存在显著差别。但是第三特征根和第四及以后的特征
根之间没有显著的差别。如果要分析主要的模态的话,最好只选择前三个进行分
析。
44
剩余13页未读,继续阅读
资源评论
- yuanfentiantian882015-03-22讲的很详细,谢谢。
- wq9632826002017-11-01百度文库里面有的 这里要6个积分 真厉害。
- sunnyohban2018-05-17百度文库里面有的 这里要6个积分 真厉害
molihua0526
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功