第2章 GIS地理基础
地球空间的认知及表达
当今,人类认识地球可以说经历了三次大飞跃,第一次“地理大发现”对地球是球体的认识,第二次“哥白尼的日心说”对地球绕日运动的认识,第三次“数字地球”的认识,则有助于人类监控地球,人们对地球科学的认知走过了艰难的历程。地球在宇宙中,受近地天体的影响,尤其是受太阳的影响。从日地关系来看,地球空间包括被太阳风包围着的、受地球磁场控制的空间区域,也是各种应用卫星、空间站和载人飞船运行的主要空间区域,是地球最重要的宇宙环境(见图2.1)。但地理学主要研究地球表层的环境特点及演变规律。人们用“空间实体”来概括表达对表层(现实世界)有意义的环境,空间实体是对现实世界有意义的东西的统称。对于空间实体来说,它是有形状的,可用维度表达。人们对地球空间的认识可概括成图2.2。

图2.1 日地关系

图2.2 地球空间的认知
地图作为一种描述、研究人类生存环境的信息载体,早已成为人类生产与生活中必不可少的工具。地图在研究地学特征规律、揭示地理过程机理、挖掘空间分布模式方面承担两大功能:一是作为分析表达工具探求地理学中的科学问题;二是作为载体传播工具交流传输地学研究成果。因此,有人把地图称为“地理学的第二语言”。实际上,地图不仅是地理学的第二语言,而且还是研究地理的核心工具。
以空间认知表达符号为主要特征的地图是一种工具, 它与代表语言的文字符号和代表数量的数字符号一起, 构成了人们认知世界的重要手段之一。地图学不仅与地理学密切相关,而且涉足科学、技术、艺术三大范畴,所以,地图不仅具有完善的科学原理、技术方法, 而且具有文化艺术特征。
地图是根据一定的数学法则,将地球(或星球)上的自然和人文现象,使用地图语言,通过制图综合、缩小反映在平面上,反映各种现象的空间分布、组合、联系、数量和质量特征及其在时间中的发展变化。地图对空间的表达具有三个特征。
(1)由地图投影、比例尺、地图定位等数学法则建立所产生的可量测性。
(2)由地图符号、地图注记等地图语言的应用而产生的直观性。
(3)由地图综合对空间表达实时抽象、概括而产生的一览性。
以上特征在比较地图表达与影像表达时可充分体现出来,如图2.3所示。

图2.3 对同一地区的影像表达与地图表达的区别
地图的构成内容,包括数学要素、地理要素和整饰要素(亦称辅助要素),被称为“地图三要素”。分别说明如下。
(1)数学要素,指构成地图的数学基础。例如:地图投影、比例尺、控制点、坐标网、高程系、地图分幅等。这些内容是决定地图图幅范围、位置,是控制其它内容的基础。它保证地图的精确性,作为在图上量取点位、高程、长度、面积的可靠依据,在大范围内保证多幅图的拼接使用。数学要素,在军事和经济建设上都是不可缺少的内容。
(2)地理要素,是指地图上表示的具有地理位置、分布特点的自然现象和社会现象。因此,又可分为自然要素(如水文、地貌、土质、植被)和社会经济要素(如居民地、交通线、行政境界等)。
(3)整饰要素,主要指便于读图和用图的某些内容。例如:图名、图号、图例和地图资料说明,以及图内各种文字、数字注记等。
20世纪60年代,计算机出现并引入地图之后,就出现了计算机辅助制图;接着,20世纪80年代出现制图专家系统;20世纪90年代及以后,随着数字制图技术及计算机图形学技术的快速发展,数字媒体在地图学中被大量应用,数字制图技术从生产传统的二维静态地图发展为制作多维动态地图、电子地图,从系列图发展到地学信息图谱。目前,地图生产正朝着一体化、自动化和智能化以及产品多样化方向发展。地图是一种地理语言,是作为地理信息传输工具不可缺少的媒介。在地图语言中,最重要的是地图符号及其系统,它形象直观,一目了然,既可显示出制图对象的空间结构,又能表示在时、空中的变化。其次是地图注记,它借用自然语言和文字形式来加强地图语言的表现效果,完成空间信息的传递,并与地图符号配合使用,以弥补地图符号之不足。第三是地图色彩,它是地图语言的一个重要内容,一方面充当地图符号的一个重要角色,另一方面还有装饰美化地图的功能。在地图上运用色彩可增强地图各要素分类、分级的概念,反映制图对象的质量与数量的多种变化;利用色彩与自然地物景色的象征性,可增强地图的感受力;运用色彩还可简化地图符号的图形差别和减少符号的数量(例如,用黑、棕、蓝三色实线表示道路、等高级和水涯线);运用色彩又可使地图内容相互重叠而区分为几个“层面”,提高了地图的表现力和科学性。此外,地图上可能出现的“影像”和“装饰图案”,它们虽不属于地图符号的范畴,但也是地图语言中不可缺少的内容。地图的“影像”,它是空间信息特征的空间框架;“装饰图案”多用于地图的图边装饰,它可以增加地图的美感,并且可以烘托地图的主题。
随着计算机技术的发展,表达地理环境的手段也在更新,从手工地图制图发展为计算机制图,接着出现桌面GIS,网络(移动)GIS,虚拟(三维)GIS。GIS是发展中的地理学语言,是一个空间数据库支持的计算机系统。GIS将地理环境的各种要素,包括它们的空间位置、形状及分布特征和与之有关的社会、经济等专题信息以及这些信息之间的联系等进行获取、组织、存储、检索、分析,并在管理、规划与决策中应用。多媒体技术和可视化技术及其与之相连的软硬件的发展,促进了地图新图种――电子地图的产生。与纸质地图相比,电子地图最显著的特征是数据的存储与数据的显示相分离,由此产生电子地图的新特点:动态性、交互探究性、超媒体结构。作为地理学语言,地图以其图形符号传达地理环境的信息。地图提供了GIS发展的基础,GIS以其地理编码数据库引领了地理环境空间信息分析的年代。目前,人们正试图将地图符号和图像信息综合到图像数据库,并加入模型库而形成双核心,从而建立地理知识共享的新平台。另外基于虚拟现实(Virtual Reality,简称VR)技术的虚拟地理环境的建立将以一种全新的方式让用户去感受现象分布、模拟地学过程。GIS是现代地理学语言,还有不少人认为GIS是继地图之后的“地理学新一代语言”。
一、地理实体和地理数据
1.地理实体和地理数据的概念
GIS的研究对象是地理实体,即指自然现象和社会经济要素中不能再分割的单元。地理实体类别及实体内容的确定是从具体需要出发的,具有很强的尺度特征。例如,在全国地图上由于比例尺很小,福州就是一个点,这个点不能再分割,可以把福州定为一个空间实体,而在大比例尺的福州市地图上,福州的许多房屋、街道都要表达出来,所以福州必须再分割,不能作为一个空间实体,应将房屋、街道等作为研究的地理实体,由此可见,GIS中的地理实体是一个概括、复杂、相对的概念。
地理数据用于描述空间要素的空间位置,可能是离散或连续的。离散要素是指观测值是不连续的,形成分离的要素,并可单个识别,包括点要素(如井)、线要素(如道路)和面要素(如土地利用类型)等;连续要素指观测值是连续的要素(如降水量和等高线分布)。根据空间特征,地理实体也可分为离散型和连续型两种;也可进一步简化、抽象分为点、线、面、体等类型。所有地理数据都是地理实体的概括,反映地理实体在地表分布的定位数据都是依据一定的地表定位参照系统。
2.地理数据与地理实体的关系
地理数据是各种地理特征和现象间关系的符号化表示,是一种较复杂的数据类型,涉及到空间特征、属性特征及它们之间关系的描述,人们常把地理数据称为空间数据。然而,地理实体以什么形式存储和处理反映了实体空间、属性和时间三个特征,也是地理空间分析的三大基本要素。其中空间特征包括地理位置和空间关系,定位数据描述地物所在位置,这种位置既可以根据大地参照系定义,如大地经纬度坐标,也可以定义为地物间的相对位置关系,如空间上的距离、邻接、重叠、包含等;属性特征又称为非空间特征,是属于一定地物、描述其特征的定性或定量指标(包括名称、等级、类别等),即描述了信息的非空间组成部分,包括语义与统计数据等;时间特征是指地理数据采集或地理现象发生的时刻或时段,反映时序变化等,时间数据对环境模拟分析非常重要,受到GIS学术界的重视。根据所描述的内容,地理数据又可分为几何数据(空间数据、图形数据)、关系数据(实体间的邻接、关联、包含等相互关系)、属性数据(各种属性特征和时间)、面向对象数据、元数据等。
在地图中描述地理实体或地理数据的位置可用地理坐标,在GIS中,位置除了用坐标表示外,还以拓扑特性来描述面状或线状地理数据的相对位置关系。
在地图中地理实体的属性通常以地图符号的形状、颜色和大小表示。在GIS中,它们则以代码、文字或数字表示。属性数据可划分为两大类,即定量数据和定性数据。定量数据反映地理实体的数量特征,如:气温、降水量、人口数、粮食产量等;定性数据则反映地理实体的质量特征,如:农作物的种类、土壤质地、地名等。
从地理实体到地理数据、从地理数据到地理信息的发展,反映了人类认识的一个巨大飞跃。本书采用的“地理数据”定义为:是指表征地理圈或地理环境固有要素或物质的数量、质量、分布特征、联系和规律的数字、文字、图像和图形等的总称。
若把与人类居住的地球有关的信息称为地学信息,那么,它们具有无限性、多样性、灵活性等特点。地学信息是人们深入认识地球系统、合理开发资源、净化能源、保护环境的前提和保证。地理信息与地学信息的区别主要在于信息源的范围不同,地理信息包括地球表面的岩石圈、水圈、大气圈和人类活动等;地学信息所表示的信息范围更广泛,不仅来自地表,还包括地下、大气层甚至宇宙空间。
3.地理数据与比例尺
地理数据(在第1章曾介绍过)除了相关性、地域性、复杂性和层次性外,还具有概括性。用地理数据表示现实世界经历了一定的对地理实体的概括和综合过程的,地图概括、地图比例尺的概念都反映了这个特征。所以地理数据是有选择地表示那些反映客观世界的主要地理实体及其重要特征,其表示的地理实体的数量和特征的详略程度主要受地图比例尺和影像空间分辨率的影响,如图2.4所示。

图2.4 同一区域地理实体在不同比例尺下的表达
在GIS中,地理数据对地理实体概括描述的程度主要以地图比例尺表示。地图比例尺定义为地图上一条直线段的长度与其在地面上相应的水平投影长度之比。地图比例尺主要有三种形式:数字式、说明式和图解式。GIS在地图形式显示或输出地理数据时,经常使用图解式比例尺。这是因为随着显示在计算机屏幕上的地图的放大或缩小,图解比例尺相应地按比例拉长或缩短。
比例尺的大小决定地图表达地理实体内容的详略,对地理数据所表示的地理实体详略程度有影响。但GIS表达地理实体主要与数据库中的数据量多少有关;GIS中地理数据的精度
及其所表示的地理实体的详略程度,主要取决于原始地图或影像资料的比例尺。
4.地理数据的分类与编码
地理数据或信息种类繁多、内容丰富,只有将“现实世界”按一定的规律进行分类和编码,才能使其在“信息世界”中有序地存储、检索,以满足各种应用分析需求,因此,基础地理数据的分类和编码是GIS空间数据库建立的重要基础(关于地理数据分类和编码的原则详见第4章)。
(1)属性数据编码
在属性数据中,有一部分是与几何数据的表示密切相关的。例如,道路的等级、类型等,。在GIS中,通常把这部分属性数据用编码的形式表示,并与几何数据一起管理。
编码是指确定属性数据的代码的方法和过程。代码是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。编码的直接产物就是代码,而分类分级则是编码的基础。
(2)分类编码的原则
分类是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程。分类是人类思维所固有的一种活动,也是认识事物的一种方法。
分类的基本原则是:科学性、系统性、可扩性、实用性、兼容性、稳定性、不受比例尺限制及灵活性等。
(3)分类码和标识码
分类码是直接利用信息分类的结果制定的分类代码,用于标记不同类别信息的数据。分类码一般由数字、或字符、或数字字符混合构成。
标识码是间接利用信息分类的结果,在分类的基础上,对某一类数据中各个实体进行标识,以便能按实体进行存储和逐个进行查询检索。标识码通常由定位分区和各要素实体代码两个码段构成(详见第4章)。
二、地理实体类型及空间关系
1.地理实体空间基本类型及表示方法
按空间分布特征,地理实体类型可划分为点、线、面、体。相应地实体的维数就有0、1、2、3 维之分。地理数据根据点、线、面和体的划分来描述地理实体的空间分布及其专题特性。表2.1显示了地理实体的基本类型及表示方法。
表2.1 地理实体的基本类型及表示方法
| 实体 | 包括 | 表示 | 维数 |
|
点状 | 实体点、注记点、内点、角点、节点 | 点有特定位置,不能按比例尺表示 | 0 |
|
线状 | 包括线段,边界、链、弧段、网络等 | 呈线状或带状延伸分布,在地图上它们以线状符号表示,在GIS中,看成具有相同属性的点的轨迹、线或折线,由一系列的有序集坐标表示,并有实体长度、弯曲度、方向性等特性 | 1 |
|
面状
| 多边形 | 呈面状分布,且其分布面积和实际形状轮廓能按比例表示。以面状符号表示。有离散型面状实体和连续型面状实体 离散型面状实体呈不连续的区域分布,如土地类型、作物分布、森林分布等,在地图上,以线划勾绘其分布范围,范围界限内用颜色或晕纹或文字注记填绘,表示实体的属性特征。在GIS中,一个离散型面状实体由一个有序点集构成,首末同为一点,每个点表示该面状实体轮廓边界上一个特征点,将两相邻特征点以直线相连,这个面状实体的轮廓边界就表示为一个多边形。一个离散型面状实体的地理数据包括它的所有边界特征点的(x,y)坐标序列以及它的属性特征值。离散型面状实体为二维实体 连续型面状实体在空间上每一点呈连续的区域分布,如地形、气温、降水量等,在地图上以等值线表示。在GIS中,通常以分布区域中的样本点数据来表示,每一个样本点都有一个三维坐标(x,y,z),其中(x,y)表示样本点的地理坐标,z表示其属性值,如该点的高程、气温、人口密度等。通过使用一定的空间内插值方法,表示连续、渐进的变化。连续型面状实体又称为三维实体 | 2或3 |
| 体状 | 多边形及属性 | 在GIS中,通常以分布区域中的样本点数据来表示,每一个样本点都有一个三维坐标(x,y,z),其中(x,y)表示样本点的地理坐标,z表示其属性,如该点的高程、气温、人口密度等。通过使用一定空间内插值方法,表示连续、渐近的变化。连续型面状实体又称为三维实体。 用于描述三维空间中的现象与物体。它具有长度、宽度及高度等属性 | 3 |
现实世界的各种现象是比较复杂的,往往由不同的空间单元组合而成。所以,复杂实体可由简单实体组合来表达。用点、线、面两两之间组合可表达复杂的空间问题。
在地图上,通过地图概括或比例尺改变,实体维数的表示可以改变,如:“面(大比例尺的居民点)变到点(小比例尺居民点)”或“面(双线河)变到线(单线河)”。同样,在GIS中,实体维数的表示也是根据比例尺改变的,见图2.5所示。

图2.5 四种地理实体的不同表达示例
2. 地理实体的空间关系
空间关系用于描述地理实体间构成的联合体的依存联系和分布态势,在数学欧氏空间(或称为平直空间)中,空间关系通常分为三类:拓扑关系、距离关系、方向关系。其中拓扑关系是对实体联系本质上的描述,而距离关系、方向关系是从度量上的进一步描述。本节重点介绍拓扑关系定义、种类和表达。
拓扑(Topology)一词来源于希腊文,拓扑学是几何学的一个分支,研究在拓扑变换下能够保持图形关系不变的几何属性,即“拓扑属性”,指的是几何实体的位置、距离、方位等改变后但其空间关系描述仍然一样,如一个石子位于皮球内,不论皮球的形状、大小如何改变、拉伸、压缩,石子总是位于球内,该关系即为拓扑属性。拓扑属性的例子包括 一个点在一个弧段的端点,或一个点在一个区域的边界上。而“非拓扑属性”指两点之间的距离,弧段的长度、区域的周长、面积等。
(1)拓扑关系定义
指满足拓扑几何学原理的空间数据点间的相互关系。即用结点、圆弧和多边形所表示的实体之间的邻接、关联和包含等关系。或指虽图形保持连续状态下变形,但图形关系不变的性质(如将橡皮任意拉伸,压缩,但不能扭转或折叠)。
(2)拓扑关系种类
依系统元素之间的关系可分为关联性、邻接性、连通性、包含性等。
① 关联性:指不同类要素之间,如图2.6中的结点(9)与弧段(5、6、3)关联,多边形(2)与弧段(3、5、2)关联。

图2.6 关联性表达
② 邻接性:指同类元素之间,如多边形之间或结点邻接矩阵表达如图2.7所示。其中“1”表示邻接,“0”表示不邻接。


图2.7 邻接性表达 图2.8 连通性表达
③ 连通性:是衡量网络复杂性的程度,常用γ指数和α指数计算它。其中,γ指数等于给定空间网络体节点连线数与可能存在的所有连线数之比;α指数用于衡量环路,节点被交替路径连接的程度称为α指数,等于当前存在的环路数与可能存在的最大环路数之比。连通性常用于网络分析中确定路径或分析街道是否相通等。连通矩阵如图2.8所示,其中“1”表示连通,“0”表示不连通。
④ 包含性:指面状的实体包含了哪些线(弧)、点或面状实体。
(3)拓扑关系表达
GIS领域目前对于拓扑关系的表达普遍采用Egenhofer的9交叉模型。该表达模型首先对线、面几何目标根据其拓扑功效划分三个部位:边界¶Y、内部Yo、外部Y- ,然后通过这些部位的二元逻辑交运算,根据结果0/1(无交/有交)的组合值确定拓扑关系的种类,然后寻求对应的自然语言的描述。由于两实体比较三个部位的组合产生3×3=9种组合,因此称“9交叉模型”,通常采用3×3的矩阵来表示。如图2.9所示。

图2.9 面、线目标的拓扑部位表示(其中:边界¶Y、内部Yo、外部Y-)
通过分析弃除矩阵中无意义的0/1组合,最后得到线与面目标的拓扑关系有19种,面与面目标的拓扑关系有8种,分别如图2.10和图2.11所示。

图2.10 线与面目标的19种拓扑关系表达

图2.11 面与面目标的8种拓扑关系表达
(4)拓扑数据结构存储
空间数据的拓扑关系如图2.12所示,结构存储表达如表2.2(a)~(d)所示。其中表2.2(a)是结点与弧段的拓扑关系。

图2.12 空间数据的拓扑关系
表2.2(a) 结点与弧段的拓扑关系
| 结点 | 通过该结点的链 |
| N1 | C1,C3,C6 |
| N2 | C1,C2,C5 |
| N3 | C2,C3,C4 |
| …… | …… |
表2.2(b)弧段与结点的拓扑关系
| 弧段(链) | 链的两端结点 | |
| 从 | 到 | |
| C1 | N2 | N1 |
| C2 | N3 | N2 |
| C3 | N1 | N2 |
| …… | …… | …… |
表2.2(c) 弧段与多边形的拓扑关系
| 弧段(链) | 多边形 | |
| 左面 | 右面 | |
| C1 | Ф | P1 |
| C2 | Ф | P2 |
| C3 | Ф | P3 |
| …… | …… | …… |
表2.2(d) 多边形与弧段的拓扑关系
| 多边形(面) | 构成多边形(面)的弧段 |
| P1 | C1,C6,-C5 |
| P2 | C2,C5,C4,C7 |
| P3 | C3,-C4,-C6 |
| …… | …… |
(5)拓扑关系对GIS空间分析的意义
拓扑关系对于数据处理和GIS空间分析具有重要的意义。表现为:第一,拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何关系具有更大的稳定性,不随地图投影而变化;第二,拓扑有助于空间要素的查询,利用拓扑关系可以解决许多实际问题(如区域的邻接和相邻问题分析);第三,根据拓扑关系可重建地理实体,这对于虚拟GIS发展很有利。
2.1.3地理数据、地理实体与图层
在GIS中,地理数据是以图层(Map Layer 或Coverage)为单位进行组织和存储的。所谓图层,就是一组相关信息或数据的集合,也是一种的特殊的文件类型。一幅图层表示一种类型的地理实体,它包含了以一定的栅格或矢量数据结构组织的有关同一地区、同一类型地理实体的定位和属性数据,这些数据相互关联,存储在一起形成一个独立的数据集(Dataset)。由于一幅图层反映某一特定的主题,因此,它又称为专题数据层(ThematicData Layer)。图层表示法就是以图层为结构表示和存储综合反映某一地区的自然、人文现象的地理分布特征和过程的地理数据,这种方法实际上源自传统的专题地图表示法。专题地图主要用于反映某一主题地理现象的分布特征,一个地区的自然和人文地理综合特征是通过使用一系列的专题地图来表示的。存储在GIS中的每一幅图层可看作是一幅反映单一主题现象的专题地图,但是,一个图层只能用于描述单一地理实体(点、线或面)。
1.地理数据或实体分层基本原则和方法
我们在划分图层时遵循基本的原则有:①不同的图形对象类型存放在不同的图层;②基础地理数据作为单独图层;③ 依系统对各种数据的处理方式不同而分层存放。实施的方法如下。
(1)专题分层:每图层对应一个专题,包含某一种或某一类数据或实体。如地貌层、水系层、道路层、居民地层等。
(2)时间序列分层:把不同时间或不同时期的数据作为一个数据层。如2000年和2005 年福州林地数据就可存放两个图层中。
(3)几何特征分层:把点、线、面不同的几何特征数据分成不同的层,如高程点只有位置,没有长度与面积;如道路、水系等,抽象成线,由点串构成,有长度属性;面状的水库湖泊等,不但有位置,而且还有面积、周长等属性。
2、地理数据或实体分层的目的
地理数据分层后便于空间数据的管理、查询、显示和分析等。主要目的为:
(1)空间数据分为若干数据层后,对所有空间数据的管理就简化为对各数据层的管理,而一个数据层的数据结构往往比较单一,同一层内的数据具有相同的属性结构、几何维数和空间操作,便于实施相同的存储管理
(2)对分层的空间数据进行查询时,不需要对所有空间数据进行查询,只需要对某一层空间数据进行查询即可,因而可加快查询速度。
(3)分层后的空间数据,由于便于任意选择需要显示的图层,因而增加了图形显示的灵活性。
(4)对不同数据层进行叠加,可进行各种目的的空间分析,特别有利于地图的叠加分析。
3.处理数据时应注意的问题
在使用GIS采集和处理地理数据、地理实体和图层之间的关系时,应注意以下几个问题。
(1) 某些空间数据库管理系统要求把点、线、面实体分别组织、存储在不同的图层中,如ESRI早期版本的Arc/Info对Coverage的存储,点与面目标不能存放在一起。
(2) 由于不同属性描述,所定义的属性表是不一样的,所以,同一种几何类型但功能不同的地理实体应分别组织、存储在不同的图层中。
(3) 反映同一地理实体但具有不同比例尺或不同资料来源的地理数据应分别组织、存储在不同的图层中。
(4) 对来源于不同部门或需要经常更新的地理数据应分别组织、存储在不同的图层中。
(5) 当研究的区域范围较广时,由于地理数据量大,应注意合理分幅,然后再将各分幅数据分别存储,构建所需的图层。

