研究生地理数学方法 第二篇 回归分析与相关分析(Part 2)
1
第二篇 回归分析与相关分析
科学研究的主要功能是借助因果关系进行解释和预测,回归分析和相关分析是我们利用建
立数学模型的过程和结果进行解释和预测的重要途径。在地理研究中,回归分析和相关分析是
最常用也最重要的两种统计分析技术,它们主要被用于回答一些定义明确的数值变量之间的关
系问题。所谓回归分析(regression analysis),描述的是一个或多个自变量的变化如何引起因
变量变化的一种统计分析方法;而相关分析(correlation analysis)则是描述两个数值变量间的
关系强度问题。回归分析和相关分析在处理数值变量关系时可以互为补充、相辅相成。
回归的原义是能力或者表现的往回走,但在统计学中,回归是一个专业化较强的术语。相
关一词的含义比较接近日常用语,没有太强的专业术语色彩,主要用于指示数值变量的关系强
度。本章着重讲授回归分析,只要掌握了回归分析,相关分析就不难理解和应用。
回归分析和相关分析是如何引入地理学特别是人文地理学研究的,目前尚有一些争议。但
是,可以肯定的是,回归分析的数学基础之一——最小二乘技术的产生却与地理事业有一定的
历史渊源。
第 3 章 问题的产生与理论的发展
回归分析一般基于两种分析方法,一是最小二乘法(least square method, LSM),二是有
关的迭代(iteration)计算方法法。实际上,最小二乘法也可以借助迭代法达到求解目标。最
小二乘法又可以分为多个种类,地理分析中经常用到的是普通最小二乘法(OLS)。最小二乘
是最为基本的分析技术,但它的产生却不是一帆风顺的,其源流可以追溯到人类早期的地理探
险活动。实际上,回归分析的创始人 Francis Galton 同时也是一个优秀的地理学家。
§3.1 问题的产生
“地理大发现”前后,由于远洋航行的需要,测定船只的地理位置成为一个重要问题。今
天的航海可以借助卫星导航和定位,全球定位系统(GPS)技术的发展使得普通的渔夫在海上
也不至于迷途。但在 18 世纪以前,远洋航行的定位却是重大的技术问题。可以想见:海上运
行途中是难以直接测量地理位置的。后来,借助几何学原理,航海家想出了一个办法:以月亮
为参考位置,据以确定航船的方位。为此,需要建立如下方程
0
3322110
=
+
+
+
θ
θ
θ
xxxx
, (3-1-1)
这里变量 x
0
、x
1
、x
2
、x
3
是以月亮为参考位置的观测数据,它们都可以直接测量。因此,只要
求出参数 θ
1
、θ
2
和 θ
3
,就可以确定船只所在的位置。后面将会看到,这是一个多元线性回归问
题,不过当时没有回归的概念。
我们知道,解决问题的方程组可以分为三类:一是恰定方程组,即变量数目等于方程数
目,方程组的解是唯一的。这类方程组最为常见。二是欠定方程组,方程的数目小于变量数
目,方程组的解不是唯一的。三是超定方程组,方程的数目大于变量的数目,回归分析用到都
属于此类。在理论上,只要所有的方程都用上,解是唯一的。但在实际操作中,往往由于拟合
的方法不一样,求解的结果有一定的出入。
三个未知数,只需要测量三次,建立恰定方程组