ARC/INFO 在生态学中的应用
国庆喜
2000 年
1
第一章 前言
早在 30 年前,一些地理学家们就在构思一种能在计算机上存储和管理信息的系统。
近十年来,这种技术已经发展成熟起来,即地理信息系统(GIS),并得到了广泛的应
用。例如土地利用规划,自然资源管理,环境评估和规划,生态学研究,急救车船的
派遣,地貌研究,商业用途等等。GIS 可以说是当前计算机最广泛的应用领域。
为什么人们对 GIS 的兴趣与日俱增?因为 GIS 所提供的处理数据的手段可以帮助
我们认识目前人类所面临的棘手问题——滥伐热带林,酸雨,城市化迅速,人口过多 ,
饥饿,疾病的蔓延,全球气候变化所带来的影响,等等。GIS 可以帮助我们将这些问题
的相关数据组织起来,并阐明它们之间的空间关系。从而为制定更明智的决策提供依
据。
GIS 之所以发展得如此迅速,首先归因于急速下降的计算机硬件价格,使更多的人
对 GIS 不再是可望而不可得。更重要的原因是,我们逐渐意识到我们的世界离不开地
理学(及其描述数据),几乎每个决策都受到地理因素的制约和影响。我们尽可能以
最短的路径派遣救火车去火场;研究疾病时,要确定流行的地区和蔓延速度;研究某
物种的分布,需要了解该物种与气候、地貌等因素的关系,等等,就要求掌握尽可能
详尽的地理信息,因此也促进了 GIS 技术的发展。GIS 可用于广阔的领域,如区域开发
战略研究、农村或城市发展规划、专业分析与专业制图、地形制图和地形分析、地籍
制图和地籍管理、市政工程设计、航空摄影和遥感卫星分析与制图等。
至今仍存在难于克服的弱点,如数据标准、地理分析模型、空间分析精度和查询
速度等,地理信息模式并不是简单的算术运算,例如在土地质量评价、土地适宜性评
价、土壤侵蚀评价、环境质量评价、生产潜力分析、农业结构优化、区域开发方案等
工作中,若需要应用计算机来模拟,必须先建立相应的数学模型。
GIS 的概念
“一种将计算机硬件、软件、地理数据及使用者的目的组织起来的集合体,可以有
效地获得、存储、更新、处理、分析和表现各种形式的地理相关信息。”
虽然这个定义比较确切,被广泛接受,但对新学者却没有多大的益处,目前可以
考虑这个简单的定义:“能够存储和使用数据来描述地球表面位置的计算机系统。”
很多计算机程序,如 AUTOCAD、SAS 等,也可以处理简单的地理或空间数据,
那么为什么他们就不能称作 GIS 呢?答案是:只有能够对数据进行空间操作的才能称
2
为 GIS。
GIS 可以链接不同系列的数据,例如,假设你想知道每个国家生产的粮食中,用于
出口部分的百分比。你已经找到了你要的数据,但是每个国家的粮食总产量的数据存
储在一个文件中,而粮食出口数据却存储在另一个文件中,你必须将这两个文件组合
起来才能解决这个问题。一旦将文件组合之后,让计算机给出答案就轻而易举。
为什么数据的链接如此重要?设想一下,如果对某个地区有两套数据,例如县的
年收入和住房平均费用。每套数据都可以单独分析和制图。当然也可以将他们组合起
来,得到更多的信息。但是,假如你有 20 套该县的数据,就可能有上百万个组合。尽
管并不是所有的组合都有意义(例如失业与土地类型),你也可以比单独处理这些数
据回答更多的问题。要做到这一点,你需要 GIS。
GIS 能够回答的问题
1. 位置问题。即“在某个特定位置有什么”的问题。位置可以用多种方式描述,如
名称,邮编,地理参照物等。
2. 条件问题。即“在哪里”的问题。这个问题与上述相反,并且需要依靠空间分析
来回答。这个问题要求找到满足某个条件的地点。(比如要找到一块无林地,
要求是面积为 2000 平方米,距离公路 100 米以内,土壤可以支撑建筑物)。
3. 趋势问题。即“自从……以来发生了哪些变化?”的问题。可以观察某地区随时
间的变化。
4. 格局问题。这个问题较为复杂。比如要确定核电站附近的居民,其死亡是否
主要由癌症所致。
5. 模型问题。即“如果……,会发生什么?”的问题。例如如果一条新道路加入网
络,或一种有毒物质渗漏至当地水源供应的地方时,会发生什么事情。回答这
些问题需要有关地理学以及其他的信息。
需要注意的几个问题
GIS 并不仅仅是一个简单的计算机制图系统,尽管它能够以各种比例尺、各种
投影方式和各种颜色制图。GIS 是一个分析工具。它的主要优点在于使你确定图形
特征之间的空间关系。
GIS 并不是以传统的方式存储图形,它存储数据,你可以用来绘制图形以满足
不同需要。
GIS 将空间数据与某一地图特征的地理信息连接起来。这个信息作为图形特征
3
的属性被存储起来。例如,在地图上表示道路的一条线只能告诉你道路的位置,
为了查找道路宽度和铺设材料类型等信息,你必须查询数据库。
总之,GIS 不存储地图或图像,它存储数据库。数据库的概念是 GIS 的核心,
也是 GIS 与其他绘图系统的主要区别。
第二章 地理数据概念
在一个 GIS 项目中,第一步是建立一个数字地图数据库。必须明确应该存储哪些
信息,如何记录数据,以及如何使用这个地图数据库。
地理数据的表示
地图的信息有两种。一种是空间信息。描述地理特征的位置和形状,以及与其他
特征的空间关系。一种是关于这些特征的描述信息。
地图用点、线、颜色、图形符号和文字等形式,通过地理特征符号来表示现实世
界。这里先介绍点、线、面的特征。
点特征:表示有关特征的位置信息,用特定的符号或标识来表示。当某一特征太
小,无法用线或面表示时,一般使用点特征。如水井、电线杆等。也可用点表示没有
面积的位置,如山峰。
线特征:表示线型特征,如公路、河流、管线等。当某一特征太窄,无法表示面
积时,一般使用线特征。也可以是没有宽度的特征,如等高线。在 ARC/INFO 中,
“线”即指弧。
面特征:面特征是指用边界线包围起来的同质区域。如国家、县、水体。
ARC/INFO 的主要基本空间特征有:
点:定义为空间的一对 XY 或 XYZ 坐标。
线:定义为一系列有顺序的空间点。
面:由一组或多组线围成的多边形。
结点:线的起点或终点。其中只作为一条线的起点终点的叫悬挂结点。有两条线
通过或既是一条线的起点又是其终点叫伪结点,因为去掉此结点,不影响围成的多边
形及线的连通关系。。
4
存储地理数据
一个数字地图数据库包括两类信息:空间的和描述性的。计算机存储一系列的文
件,包含有地图特征的空间或描述性的数据。GIS 的能力在于它可连接两种数据,并且
保持地图特征之间的空间关系。
将图形数据与表数据集成在一起,增强了分析数据的能力。你可以通过地图来获
取表数据库信息,或者基于表数据库信息来生成地图。
地球表面的特征是用点、线、面绘制在二维的平面图上的。可以用 x,y 坐标系统
(Cartesian)将图上位置与实际位置联系起来。每个点都有 x,y 坐标对,线特征是用
一组有序的 x,y 坐标来记录的,面特征用一组 x,y 坐标对定义的封闭的弧线表示。
刚才所阐述的坐标其实都使用页面单位,如英尺或厘米,来测量图上距离,或查
找某一 x,y 坐标位置。但地图通常要表示现实世界的坐标,那么这些坐标就代表了地
球表面某处的真实位置。
在任一研究区域,都可以根据需要和可能选择地理要素,通常应包括基本地理要
素,如河流、地形、居民点、交通等。其每一要素在 ARC/INFO 中称为“层”,即要素层。
如果面对一个较大的研究区域,可以划分成若干个子区,称为分区(Title),分
区方法可以是地形图分幅、行政区、自然区、流域范围等。
对于每一个要素层,视其复杂程度,进一步分解为若干个子层,例如水网,可以
区分出河流和湖泊,前者是线状要素,后者是多边形。又如点状要素和面状要素不能
共存于一个子层中,因为每一个多边形都具有一个内部标识点。
ARC/INFO 将每个分区中的每一个子层的图形形式称为 MAP SHEET,其中对应的
数字形式叫做 Coverage,前者是资料加工、数字化的基本单元,后者是计算机管理、
编辑和存储的基本单元。ARC/INFO 的各种功能都是围绕着如何输入、编辑、处理和
显示 Coverage 提出来的。
ARC/INFO 提供了灵活的管理方式,采用了索引和文件相结合的方法,每一个
Coverage 下,总是由若干文件组成。用户可以在任何一层操作 ARC/INFO,解决不同
的问题。每个 Coverage 由下列文件组成:
1, TIC 文件,即地面控制点文件,是用来进行几何纠正和坐标变换的参考点文
件,最少由 4 个 TIC 点组成。
2, BND 文件,即控制一个 Coverage 的范围文件,在图形编辑、图形输出中起到
边界控制作用。
3, ARC 文件,即弧段文件。弧段是基本存储单元,一个弧段的数据包括两端节
点和弧段上的特征点(转弯点)坐标组成。对应于 ARC 文件的是 AAT 文件,即弧段
属性文件,它表达每个弧段的基本特征,包括起始和终止节点号,弧段左右两边的多
边形记录号,弧段内部记录号,弧段用户识别号,弧段长度。
4, POINT 文件,如果存在点状特征时,数字化后就会产生这种文件,并对应于
5