GIS相关概念
一、数据和信息与地理数据和地理信息
1.数据和信息
数据(data)是对客观事物的符号表示。数据是指某一目标定性、定量描述的原始资料,包括数字、文字、符号、图形、图像以及它们能转换成的数据等形式。数据是用以载荷信息的物理符号,数据本身并没有意义。数据在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。它可以是文字符号、图形、图像或声音。数据项可以按目的组织成数据结构。但数据的格式往往与计算机系统有关,并随载荷它的物理设备的形式而改变。
信息(information)是用文字、数字、符号、语言、图像等介质来表示事件、事物、现象等的内容、数量或特征,从而向人们(或系统)提供关于现实世界新的事实和知识,作为管理、分析和决策的依据。信息源自数据,信息是经过加工后的数据,它对接受者有用,对决策或行为有现实或潜在的价值。将数据与上下文联系通过解译产生了语义、关联、施效等特征,可回答事物、现象的状态、性质、过程等特征问题,这时便产生信息。学术界目前对“信息”仍未形成完全一致的定义。主要有:①信息论的创始人香农从作用或功能的角度定义为“信息是用来消除随机不确定性的东西”。②控制论的创始人维纳则认为:“信息是我们适应外部世界,并且使这种适应为外部世界所感知的过程中,同外部世界进行交换内容的名称”。③还有人将“信息”理解为集合的变异度、事物的差异或关系,以及系统的有序性等。广义的信息是物质运动状态和状态改变的方式,它通过数字、语音、图像、文本、图形等媒体形式来表现,它蕴含着事物相互间联系、发展趋势、过程规律等,信息的行为过程包括:获取、再生、施效、传递、系统优化或自组织、智能化等过程,对信息进一步加工凝练,通过集成融合和认知推理,获得抽象概念、规则、因果联系等,便获得知识。
信息是近代科学的一个专门术语,因其在现代社会中的重要性逐渐产生了专门收集、管理、处理和分析信息的体系——“信息系统”,而随着现代计算机技术的发展,又使得“信息系统”与计算机的软、硬件之间产生了密切的联系。
信息对决策是十分重要的,信息系统将地理空间的巨大数据流收集、组织和管理起来,经过处理、转换和分析变为对生产、管理和决策具有重要意义的有用信息。
信息具有一些基本属性,即:客观性、传输性、共享性、适应性、等级性、可压缩性、扩散性、增殖性、转换性等。但其最主要的特点如下:
(1)客观性:任何信息都是与客观事实紧密相关的,具有本质意义特征,它是对客观事物存在状态、行为过程、现象规律的外在表征表达,这是信息正确性和精确度的保证;
(2)传输性:信息可以在信息发送者和接受者之间传输,发送者将信息编码后在信息通道中实时转移,接受者获取后对其进行解译,这便是“香农”信息熵传输过程。在信息系统中既包括系统把有用信息送至终端设备(包括远程终端)和以一定的形式或格式提供给有关用户,也包括信息在系统内各个子系统之间交换,如网络传输技术等。
(3)共享性:信息与实物不同,信息可以传输给多个用户,为多个用户共享,而其本身并无损失。信息的这些特点,使信息成为当代社会发展的一项重要资源。
信息与数据既有区别但又不可分离。信息是与物理介质有关的数据表达,数据中所包含的意义就是信息。数据是记录下来的某种可以识别的符号,具有多种多样的形式,也可以由一种数据形式转换为其他数据形式,但其中包含的信息的内容不会改变。数据是信息的载体,但并不就是信息。只有理解了数据的含义,对数据做出解释,才能提取数据中所包含的信息。对数据进行处理(运算、排序、编码、分类、增强等)就是为了得到数据中包含的信息。虽然日常生活中数据和信息的概念区分得不是很清楚,但它们有着不同的含义。我们可以把数据比作原材料,而信息是对原材料加工的结果。数据包含原始事实,信息是把数据处理成有意义的喝有用的形式。数据与信息及有区别又有联系,数据时原始事实,信息是对数据处理的结果;对一个人是信息,而对其他人可能是数据;信息必须是有意义或有用的;使用的信息必须是完整、精确、相关和及时的。人的知识、经验作用到数据上,可以得到信息,而获得信息量的多少,与人的知识水平有关。
2.地理数据和地理信息
地理信息源自地理数据。地理数据是对与地球表面位置相关的地理现象和过程的客观表示。地理信息则指与研究对象的空间地理分布有关的信息,可表示地理系统诸要素的数量、质量、分布特征。如遥感影像通过像素的灰度、纹理、波谱特征记录了地表的现象分布,为原始的“数据”表达,通过加工处理对影像数据进行解译,获得不同用地类型的分布,即为“信息”内容。对地观测系统的工作就是从数据获取到信息加工,再到知识发现的过程。
地理信息除了具有一般信息的特点外,更强调空间相关性、空间地域性、空间层次性,空间多样性等。
(1) 空间相关性:任何地理事物都是相关的,并且在空间上相距越近则相关性越大,空间距离越远则相关性越小,同时地理信息的相关性具有区域性特点(这就是有名的地理第一定律)。
(2) 空间地域性:地理信息属于空间信息,这是地理信息区别于其它类型信息的最显著的标志――地域性,即空间分布特性。其位置的识别与数据相联系,它的这种定位特征是通过公共的地理基础来体现的。先定位后定性,并在区域上表现出分布特点。
(3) 空间层次性:地理信息的层次性首先体现在同一区域上的地理对象具有多重属性,其属性表现为多层次海量的信息。由于地理环境非常复杂,数据组织需要专门的数据结构和模型、空间数据库系统来有效地处理地理信息。
(4) 空间多样性:地理信息内容丰富,形式复杂多样,具有二维、三维、多维结构的特征(即指在同一位置上可有多种专题的信息结构);具有动态和时序变化的特点(时空的动态变化引起地理信息的属性数据或空间数据的变化)。这就为地理信息系统多元信息的复合研究和探索地理现象间的内在规律以及实时的GIS系统构建奠定了基础。
基于特定的专业模型通过一定的科学计算,人们从大量的数据中挖掘出隐藏的有价值的信息,包括空间现象的分布规律、过程趋势、现象机理等,这是目前人们最感兴趣的数据挖掘和知识发现(DM_KDD)。有关数据挖掘技术与GIS结合也是未来GIS发展的方向(相关内容后续章节介绍)。
进入21世纪初,大数据一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到数据爆炸性增长带来的机遇与挑战,但随着时间的推移,人们将越来越多的意识到数据对社会发展的重要性。大数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。地理大数据或空间大数据作为互联网时代大数据的特定分支,对地理信息资源的研究、开发和应用也将产生深远的影响。基于海量的对地观测数据、社交网上庞大的时空位置数据、网络用户上传的大量自发地理数据,在揭示资源环境变化规律、不同社会群体时空出行模式、地理现象分布特征与演变机理等方面将获得重要进展,推动地学领域的发展,促进地理信息技术向智能化方向迈进。
二、系统、信息系统和GIS
1.系统
由相互联系、相互依存又相互协调的事物构成的统一体称为系统。每一个系统都是由其内部要素所构成,而该系统又可能是更大系统的组成部分。系统具有如下特征。
(1)总体性:系统的构成元素按照统一性要求而构成一个集合,它不是简单的组合,而是具有总体大于部分之和的效应。
(2)关联性:系统的各元素相互联系、相互作用、相互影响。
(3)功能性(目的性):系统具有特定功能,为特定目标服务。
(4)环境适应性:其他外部元素构成系统的环境,系统与环境要进行物质、能量、信息的交换,系统有适应外部环境变化的功能。
从系统论观点来看,地球就是一个既有序又复杂的相互联系的系统。在地球表层,气候、水文、土壤、植被、地形等各地理要素构成的相互联系的物质、能量和信息的空间体系称为地理系统,包括物质循环、能量流动、信息交流等体系。
2.信息系统和GIS
信息系统是现代管理与决策工作的重要手段,即指具有采集、管理、分析和表达数据能力的系统,它能够为单一的或有组织的决策过程提供有用的信息。一个信息系统的优劣应根据它所提供的信息质量和数量来判断,而这又取决于信息系统中的数据分析功能和数据分析模型。智能化的信息系统是当今信息系统的发展趋势。根据数据处理对象可分为空间信息系统和非空间信息系统。前者主要处理带有位置和属性特征的数据,而后者则只有一般事务性数据(不含空间特征);从应用层次上考虑,信息系统有事物处理系统、管理信息系统(企业、事业管理信息系统、财务管理信息系统等)、决策支持信息系统等。地理信息系统(GIS)在处理对象上属于空间信息系统,在应用层次上则属于决策支持系统。常见的GIS同义词,见表1.1。
表1.1GIS同义词
| GIS术语 | |
| 美国术语 | 地理信息系统(Geographical Information System,简称GIS) |
| 欧洲术语 | 地理信息系统(Geographical Information System,简称GIS) |
| 测绘专业(加拿大术语) | 地球信息科学(Geomatique) |
| 基于技术的术语 | 地学相关的信息系统(Georelational Information System,简称GIS) |
| 基于学科的术语 | 资源和环境信息系统(Resources and Environmental Information System, 简称REIS) |
| 非地理学术语 | 地球科学或地质信息系统(Geoscience or Geological Information System,简称GIS) 空间信息系统(Spatial Information System,简称SIS) |
| 基于系统的术语 | 空间数据分析系统(Spatial Data Analysis System,简称SDAS) |
| 现代地球信息科学术语 | 地球信息科学(简称GIS) |
由于人们研究和应用领域的侧重点不同,目前没有统一的GIS定义。从20世纪60年代至今代表性的定义有:
(1)GIS之父,Roger Tomlinson(1966)认为,GIS是全方位分析和操作地理数据的数字系统。
(2)Dueker(1979)认为,GIS是一种特殊的信息系统,其数据库包含着有关分布空间上的(可以点、线或面)现象、活动或事件的观察数据。GIS处理的是反映空间分布现象的地理数据。
(3)Burrough(1986)认为,GIS是属于从现实世界中采集、存储、提取、转换和显示空间数据的一组有力的工具。
(4)Smith等(1987)认为,GIS是存储空间数据的数据库系统,以及一套用于检索数据库中有关空间实体的数据的程序。
(5)Parker(1988)认为,GIS是一种存储、分析和显示空间与非空间数据的信息技术。
(6)Goodchild(1990)认为,GIS是采集、存储、管理、分析和显示有关地理现象信息的空间信息系统,并GIS中的“S”认为不是简单的“System(系统)”,而应是“Science(科学)”。
(7)Clarke(1995)认为,GIS是采集、存储、提取分析和显示空间数据的自动化系统。
(8)Chrisman(1999)认为,GIS是人们在与社会结构相互作用的同时,测量、描述地理现象,再将这些描述转换成其他形式的有组织的活动。
(9)美国国家地理信息与分析中心给出的定义(21世纪初):GIS为了获取、存储、检索、分析和显示空间定位数据而建立的计算机化的数据库管理系统。
(10)英国教育部(21世纪初)认为:GIS是一种获取、存储、检索、操作、分析和显示地球空间数据的计算机系统。
(11)美国联邦数字地图协调委员会(Federal Interagency Coordinating Committee on Digital Cartography,简称 FICCDC)(21世纪初)关于GIS的定义:由计算机硬件、软件和不同的方法组成的系统,该系统设计用来支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题。
从上述这些定义来看,有的侧重于GIS的技术内涵,把GIS描述为一个工具箱,其中包含有一套用于采集、存储、管理、处理、分析和显示地理数据的计算机软件工具。或认为GIS是信息系统的特例,除了处理地理数据的特殊性以外,GIS具备一般信息系统的共同特点。有的则强调GIS的应用功能或社会作用,认为GIS从根本上改变了一个组织或部门运作的方式。GIS是计算机化的技术系统,它针对的对象是地理实体,是现实世界在计算机中的反映。GIS的技术优势在于它的混合数据结构和有效的数据集成、独特的地理空间分析能力、快速的空间定位搜索和复杂的查询功能、强大的图形创造和可视化表达手段,以及地理过程的演化模拟和空间决策支持功能等。其中,通过地理空间分析可以产生常规方法难以获得的重要信息,实现在系统支持下的地理过程动态模拟和决策支持,这既是GIS的研究核心,也是GIS的重要贡献。
基于上述定义,我们认为GIS是个发展的概念,内容主要有两个部分。其一,地理信息系统是一门交叉学科,是目前正在兴起的地球信息科学的主要内容;其二,地理信息系统是一个技术系统,是以地理空间数据库为基础,采用地理模型分析方法,适时提供多种空间和动态的地理信息,为地理研究和地理决策服务的计算机技术系统(见图1.1),我国目前不少学者推荐美国联邦数字地图协调委员会关于GIS的定义及概念。

综合上述表达,可以认为:GIS是在计算机软硬件支持下,对整个或者部分地球表层空间中的有关地理分布数据进行采集、存储、管理、运算、分析、显示和描述的技术系统。GIS处理和管理的对象是多种地理空间实体数据及其关系,包括空间定位数据、图形数据、遥感图像数据、属性数据等,主要用于分析和处理一定地理区域内分布的各种现象和过程,解决复杂的规划、决策和管理问题。
总之,从概念的提出到现代对概念的理解,GIS是一门不断发展、不断完善的学科和技术。关于它的英文全称,多数人认为是“GeographicalInformation System/Science或Spatial Information System/Science”,也有人基于技术内涵认为是“Geo_relational Information System或Geo_InformationSystem”。在加拿大和澳大利亚,把GIS当成LandInformation System。在我国,通常把GIS认为是Resources and Environmental Information Systems。全称虽有差异,但简称都是GIS。基本上都强调三点:①处理对象,GIS处理的是空间数据和空间信息;②处理过程,GIS是基于计算机完成的;③学科和技术,GIS强调学科的综合和空间数据的集成技术。
根据其研究空间尺度,GIS可分为全球性信息系统和区域性信息系统;根据其应用领域,可分为土地信息系统、资源管理信息系统、地学信息系统等;根据其研究内容,GIS也可分为专题信息系统和综合信息系统;根据其使用的数据结构或模型,GIS又可分为矢量型信息系统、栅格型信息系统和混合型信息系统,根据系统应用方式,可分为网络地理信息系统、桌面地理信息系统和移地理信息系统,等等。
由于技术的发展以及相关领域应用的驱动,地球信息学的内涵与外延也在不断变化,这其中主要体现在“S”的含义上。从20世纪80年代至今,先后经历了从GISystem 到GIScience再到GIService和GIStudy的发展,形成了理论研究、技术开发、工程应用与产业化管理的完善体系,几个不同侧重阶段的发展时期如图1.2 所示。

图1.2 不同历史时期GIS含义的变化
GISystem,是从技术层面的角度论述地理信息系统,即面向区域、资源、环境等规划、管理和分析,是指处理地理数据的计算机技术系统,但更强调其对地理数据的管理和分析能力,地理信息系统从技术层面意味着帮助构建一个地理信息系统工具,如给现有地理信息系统增加新的功能或开发一个新的地理信息系统或利用现有地理信息系统工具解决一定的问题,如一个地理信息系统项目可能包括以下几个阶段:
(1)定义一个问题;
(2)获取软件或硬件;
(3)采集与获取数据;
(4)建立数据库;
(5)实施分析;
(6)解释和展示结果。
这里的地理信息系统技术(Geographic information technologies)是指收集与处理地理信息的技术,包括全球定位系统(GPS)、遥感(Remote Sensing)和GIS。从这个含义看,GIS包含两大任务,一是空间数据处理;二是GIS应用开发。
GIScience,是广义上的地理信息相关问题理论方法体系,常称之为地理信息科学,是地理信息学科中共性的地理信息表达、建模、决策分析的理论方法与知识体系,它不依赖于特定的技术支撑和设备环境,将空间认知、地理信息模型、时空推理方法等集成,构成了地理信息学科的理论基础。
GIService代表着信息服务,面向政府、社会公众、个人及特定专业领域,提供用户感兴趣的问题解决方案,在位置导航、空间决策、时空规划等方面为用户展示信息功能。随着遥感等信息技术、互联网技术、计算机技术等的应用和普及,地理信息系统已经从单纯的技术型和研究型逐步向地理信息服务层面转移,如导航需要催生了导航GIS的诞生,著名的搜索引擎Google也增加了GoogleEarth功能,GIS成为人们日常生活中的一部分。当同时论述GIS技术、GIS科学或GIS服务时,为避免混淆,一般用GIS表示技术,GIScience或GISci表示地理信息科学,GIService或GISer表示地理信息服务。
GIStudies是代表研究有关地理信息技术引起的社会问题(societal context),如法律问题(legal context),私人或机密主题,地理信息的经济学问题等。
因此,GIS是一种专门用于采集、存储、管理、分析和表达空间数据的信息系统,它既是表达、模拟现实空间世界和进行空间数据处理分析的“工具”,也可看作是人们用于解决空间问题的“资源”,同时还是一门关于空间信息处理分析的“科学技术”
在本课程中,如果没有特别说明,GIS指的是“地理信息系统”。
三、GIS与相关学科
GIS作为传统科学与现代技术相结合的产物,为各门涉及空间数据分析的学科提供了新的技术方法,而这些学科又都不同程度地提供了一些构成地理信息系统的技术与方法。因此,GIS明显地具有多学科交叉的特点,它既要吸取诸多相关学科的精华,又逐步形成独立的边缘学科,又将被多个相关学科所运用,并推动它们发展。所以,认识和理解GIS与这些相关学科的关系,对理解GIS和应用GIS有很大的帮助。
与GIS相关的科学技术如图1.3所示。尽管GIS涉及众多的学科,但与之联系最为紧密的还是地理学、制图学、计算机、测绘与遥感等。

