没有合适的资源?快使用搜索试试~ 我知道了~
地统计分析方法被广泛应用许多领域,已成为空间统计学的一个重要分支
需积分: 32 33 下载量 77 浏览量
2008-11-13
13:25:04
上传
评论 1
收藏 1.79MB PDF 举报
温馨提示
试读
61页
地统计分析方法被广泛应用许多领域,已成为空间统计学的一个重要分支。很长时间 以来,地统计分析一直没能很好的和 GIS 分析模型紧密结合在一起,这成为 GIS软件一大 遗憾。ArcGIS 地统计分析模块在地统计学与 GIS之间架起了一座桥梁,使得复杂的地统计 方法可以在软件中轻易实现,体现了以人为本、可视化发展的趋势。这种结合具有重要的 开创性意义,通过测定预测表面的统计误差,GIS 应用人员首次能够对预测表面的模型质 量进行量化。本章主要通过对地统计分析的概念介绍,逐步引导读者在 ARCGIS 中如何应 用地统计分析解决实际问题。
资源推荐
资源详情
资源评论
第十章 地统计分析
地统计分析方法被广泛应用许多领域,已成为空间统计学的一个重要分支。很长时间
以来,地统计分析一直没能很好的和 GIS 分析模型紧密结合在一起,这成为 GIS 软件一大
遗憾。ArcGIS 地统计分析模块在地统计学与 GIS 之间架起了一座桥梁,使得复杂的地统计
方法可以在软件中轻易实现,体现了以人为本、可视化发展的趋势。这种结合具有重要的
开创性意义,通过测定预测表面的统计误差,GIS 应用人员首次能够对预测表面的模型质
量进行量化。本章主要通过对地统计分析的概念介绍,逐步引导读者在 ARCGIS 中如何应
用地统计分析解决实际问题。
10.1 地统计基础
10.1.1 基本原理
地统计(Geostatistics)又称地质统计,是在法国著名统计学家 G. Matheron 大量
理论研究的基础上逐渐形成的一门新的统计学分支。它是以区域化变量为基础,借助变异
函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学。
凡是与空间数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异有关的研
究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性时,皆可应
用地统计学的理论与方法。
地统计学与经典统计学的共同之处在于:它们都是在大量采样的基础上,通过对样本
属性值的频率分布或均值、方差关系及其相应规则的分析,确定其空间分布格局与相关关
系。但地统计学区别于经典统计学的最大特点即是:地统计学既考虑到样本值的大小,又
重视样本空间位置及样本间的距离,弥补了经典统计学忽略空间方位的缺陷。
地统计分析理论基础包括前提假设、区域化变量、变异分析和空间估值。
1. 前提假设
(1) 随机过程
与经典统计学相同的是,地统计学也是在大量样本的基础上,通过分析样本间的规律,
探索其分布规律,并进行预测。地统计学认为研究区域中的所有样本值都是随机过程的结
果,即所有样本值都不是相互独立的,它们是遵循一定的内在规律的。因此地统计学就是
要揭示这种内在规律,并进行预测。
(2) 正态分布
在统计学分析中,假设大量样本是服从正态分布的,地统计学也不例外。在获得数据
后首先应对数据进行分析,若不符合正态分布的假设,应对数据进行变换,转为符合正态
1
分布的形式,并尽量选取可逆的变换形式。
(3) 平稳性
对于统计学而言,重复的观点是其理论基础。统计学认为,从大量重复的观察中可以
进行预测和估计,并可以了解估计的变化性和不确定性。对于大部分的空间数据而言,平
稳性的假设是合理的。这其中包括两种平稳性:一是均值平稳,即假设均值是不变的并且
与位置无关;另一类是与协方差函数有关的二阶平稳和与半变异函数有关的内蕴平稳。二
阶平稳是假设具有相同的距离和方向的任意两点的协方差是相同的,协方差只与这两点的
值相关而与它们的位置无关。内蕴平稳假设是指具有相同距离和方向的任意两点的方差
(即变异函数)是相同的。二阶平稳和内蕴平稳都是为了获得基本重复规律而作的基本假
设,通过协方差函数和变异函数可以进行预测和估计预测结果的不确定性。
2. 区域化变量
当一个变量呈现一定的空间分布时,称之为区域化变量,它反映了区域内的某种特征
或现象。区域化变量与一般的随机变量不同之处在于,一般的随机变量取值符合一定的概
率分布,而区域化变量根据区域内位置的不同而取不同的值。而当区域化变量在区域内确
定位置取值时,表现为一般的随机变量,也就是说,它是与位置有关的随机变量。在实际
分析中,常采用抽样的方式获得区域化变量在某个区域内的值,即此时区域化变量表现为
空间点函数:
),,()(
wvu
xxxZxZ
=
(10.1)
根据其定义,区域化变量具有两个显著特征:即随机性和结构性。首先,区域化变量
是一个随机变量,它具有局部的、随机的、异常的特征;其次,区域化变量具有一定的结
构特点,即变量在点 x 与偏离空间距离为 h 的点 x+h 处的值 Z(x)和 Z(x+h)具有某种程度
的相似性,即自相关性,这种自相关性的程度依赖于两点间的距离 h 及变量特征。除此之
外,区域化变量还具有空间局限性(即这种结构性表现为一定范围内)、不同程度的连续
性和不同程度的各向异性(即各个方向表现出的自相关性有所区别)等特征。
3. 变异分析
(1) 协方差函数
协方差又称半方差,表示两随机变量之间的差异。在概率论中,随机变量 X 与 Y 的协
方差定义为:
)]Y())(X([(),( EYEXEYXCov
−
−
=
(10.2)
借鉴上式,地统计学中的协方差函数可表示为:
∑
=
+−+−=
)(
1
)]()()][()([
)(
1
)(
hN
i
iiii
hxZhxZxZxZ
hN
hC
(10.3)
其中,Z(x)为区域化随机变量,并满足二阶平稳假设,即随机变量 Z(x)的空间分布规
律不因位移而改变;h 为两样本点空间分隔距离; 为 Z(x)在空间点 处的样本值;
)(
i
xZ
i
x
2
)( hxZ
i
+ 是 Z(x)在 处距离偏离 h 的样本值[i=1,2,…,N(h)];N(h)是分隔距离为 h 时
的样本点对总数;
i
x
)(
i
xZ
和
)( hxZ
i
+
分别为 和)(
i
xZ )( hxZ
i
+
的样本平均数,即:
∑
=
=
n
i
ii
xZ
n
xZ
1
)(
1
)(
(10.4)
∑
=
+=+
n
i
ii
hxZ
n
hxZ
1
)(
1
)(
(10.5)
上式中,n 为样本单元数。一般情况下,
)()( hxZxZ
ii
+≠
(特殊情况下可以认为近
似相等)。
(2) 半变异函数
半变异函数又称半变差函数、半变异矩,是地统计分析的特有函数。区域化变量 Z(x)
在点
x
和
x+h
处的值
Z(x)
与 Z(x+h)差的方差的一半称为区域化变量 Z(x)的半变异函数,
记为 r(h),2r(h)称为变异函数。
根据定义有:
)]()([
2
1
),( hxZxZVarhxr +−=
(10.6)
即
22
)]}([)]([{
2
1
)]()([
2
1
),( hxZExZEhxZxZEhxr +−−+−=
(10.7)
区域化变量 Z(x)满足二阶平稳假设,因此对于任意的 h 有:
)]([)]([ xZEhxZE
=
+
(10.8)
因此,半变异函数可改写为:
2
)]()([
2
1
),( hxZxZEhxr +−=
(10.9)
由上式可知,半变异函数依赖于自变量 x 和 h,当半变异函数
r(x,h)
仅仅依赖于距离
h 而与位置 x 无关时,
r(x,h)
可改写为
r(x)
,即:
2
)]()([
2
1
)( hxZxZEhr +−=
(10.10)
具体表示为:
∑
=
+−=
)(
1
2
)]()([
)(2
1
)(
hN
i
ii
hxZxZ
hN
hr
(10.11)
3
各变量的含义同前。也有将 r(h)称为变异函数,两者使用上不引起本质上的差别。
(3) 变异分析
半变异函数和协方差函数把统计相关系数的大小作为一个距离的函数,是地理学相近
图 10.1 和图 10.2 显示,半变异值的变化随着距离的加大而增加,协方差随着距离的
相似定理定量量化。图 10.1 和图 10.2 为一典型的半变异函数图和其对应的协方差函数图。
加大
而减小。这主要是由于半变异函数和协方差函数都是事物空间相关系数的表现,当两
事物彼此距离较小时,它们是相似的,因此协方差值较大,而半变异值较小;反之,协方
差值较小,而半变异值较大。此外,协方差函数和半变异函数随着距离的加大基本呈反向
变化特征,它们之间的近似关系表达式为:
hr )()( hCsill
c(h)
图 10.2 协方差函数图
r(h)
图 10.1 半变异函数图
偏基台值
(Partial Sill)
块金
(Nugget)
基台值
(Sill)
变程(Range)
距离(h)
距离(h)
偏基台值
(Partial Sill)
块金
(Nugget)
变程(Range)
基台值
(Partial Sill)
−
=
(10.12)
半变异函数曲线图和协方差函数曲线反映了一个采样点与其相邻采样点的空间关系。
此外
值(Nugget):理论上,当采样点间的距离为 0 时,半变异函数值应为 0,但由于
存在
变异函数 r(h)从初始的块金值达到
一个
。
基台值时,采样点的间隔距
离称
,它们对异常采样点具有很好的探测作用,在 ArcGIS 地统计分析模块中可以使用两
者的任意一个,一般采用半变异函数。在半变异曲线图中有两个非常重要的点:间隔为 0
时的点和半变异函数趋近平稳时的拐点,由这两个点产生四个相应的参数:块金值
(Nugget)、变程(Range)、基台值(Sill)、偏基台值(Partial Sill)它们的含义表示
如下:
块金
测量误差和空间变异,使得两采样点非常接近时,它们的半变异函数值不为 0,即存
在块金值。测量误差是仪器内在误差引起的,空间变异是自然现象在一定空间范围内的变
化。它们任意一方或两者共同作用产生了块金值。
基台值(Sill):当采样点间的距离 h 增大时,半
相对稳定的常数时,该常数值称为基台值。当半变异函数值超过基台值时,即函数值
不随采样点间隔距离而改变时,空间相关性不存在。
偏基台值(Partial Sill):基台值与块金值的差值
变程(Range):当半变异函数的取值由初始的块金值达到
为变程。变程表示了在某种观测尺度下,空间相关性的作用范围,其大小受观测尺度
4
的限定。在变程范围内,样点间的距离越小,其相似性,即空间相关性越大。当 h>R 时,
区域化变量 Z(x)的空间相关性不存在,即当某点与已知点的距离大于变程时,该点数据不
能用于内插或外推。
当限定的样本点间
隔过小时,可能出现曲线图上所有 r(h)≈ Nugget,即曲线为一近
似平
越强。相
应地
地统计分析过程,或者说空间估值过程,一般为:首先是获取原始数据,
检查
数据视图窗口中添加并显示待
分析
的统计属性,对数据进行深入了
解。
的认识,初步选择一个认为合适
的模
输出(表面),了解所选模型对
未知
同参数或者选择多个可选模型创建表面,通过对比分析可以确定哪个模型
对未
行于横坐标的直线,此时半变异函数表现为纯块金效应。这是由于所限定的样本间隔
内,点与点的变化很大,即各个样点是随机的,不具备空间相关性,区域内样点的平均值
即是最佳估计值。此时只有增大样本间隔,才能反映出样本间的空间相关性。
空间相关性的强弱可由 Partial_Sill/Sill 来反映,该值越大,空间相关性
,Nugget/Sill 称为基底效应,表示样本间的变异特征,该值越大,表示样本间的变
异更多得是由随机因素引起的。
4. 空间估值
一个完整的
、分析数据,找寻数据暗含的特点和规律,比如是否为正态分布、有没有趋势效应、
各向异性等等;然后选择合适的模型进行表面预测,这其中包括半变异模型的选择和预测
模型的选择;最后检验模型是否合理或几种模型进行对比。尽管在 ArcGIS 中利用地统计
分析模块完成上述过程非常简单,但是遵循一个结构化处理过程仍很重要,如图 10.3 所示。
(1) 数据显示
在 ArcMap
的数据图层。
(2) 数据检查
数据显示
数据检查
模型拟合
模型诊断
模型比较
1
3
2
4
5
图 10.3 空间估值流程图
分析数据集
数据检查内容包括检验数据分布、寻找数据
离群值、全局趋势分析、探测空间自相关及方向
变异,以及多数据集协变分析。
(3) 模型拟合
基于对数据
型创建表面。全面的数据检查有助于选择出
合适的模型。
(4) 模型诊断
评估模型的
值的预测效果。诊断的主要内容包括:①预
测的准确性。②模型的有效性。
(5) 模型比较
通过设置不
知值的预测更好。
5
剩余60页未读,继续阅读
资源评论
geolab110
- 粉丝: 2
- 资源: 8
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功