整个地理信息系统就是围绕着空间数据的采集、处理、存储、分析和表现而展开的,在一个GIS工程中,硬件、软件和数据所占经费大致为1∶2 ∶7。因此,空间数据来源、采集手段、生成工艺、数据质量都直接影响到地理信息系统应用的潜力、成本和效率。

本章首先介绍数据源及其基本特征,同时概述空间数据采集与处理的基本流程;在此基础上,分别介绍空间数据和属性数据的采集方式,数据编辑、数学基础变换以及数据重构等数据处理的原理与方法。
GIS 数据源比较丰富,类型多种多样,根据数据获取方式可以分为:地图数据、遥感影像数据、实测数据、统计数据、多媒体数据、文本资料数据、共享数据、物联网-传感器数据和互联网数据等等。


地图是地理数据的传统描述形式,是具有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富,图上实体间的空间关系直观,而且实体的类别或属性可以用各种不同的符号加以识别和表示。国家基本比例尺系列地形图以及各类专题地图,经过数字化处理,成为GIS 最重要的数据源之一。
但在应用地图数据时要注意以下几点:
(1)地图存储介质的缺陷。由于地图多为纸质,在不同的存放条件下存在不同程度的变形,具体应用时,须对其进行纠正。
(2)地图现势性较差。传统地图更新周期较长,造成现存地图的现势性不能完全满足实际需要。
(3)地图投影的转换。使用不同投影的地图数据进行交流前,须先进行地图投影的转换。
GIS中另一种极其重要的数据源是遥感影像数据。通过遥感影像可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影像还可以取得周期性的资料,这些都为GIS 提供了丰富的信息。但每种遥感影像都有其自身的成像规律、变形规律,所以在应用时要注意影像的纠正、影像的分辨率、影像的解译特征等方面的问题。
实测数据主要指各种野外实验、实地测量所得数据,它们通过转换可直接进入GIS 的空间数据库以用于实时分析和进一步应用。其中,GPS 点位数据、地籍测量数据等通常具有较高的精度和较好的现势性,是GIS 的重要数据来源。
许多部门和机构都拥有不同领域如人口、自然资源等方面的大量统计资料、国民经济的各种统计数据,这些常常也是GIS 的数据源,尤其是属性数据的重要来源。统计数据一般都是和一定范围内的统计单元或观测点联系在一起,因此采集这些数据时,要注意包括研究对象的特征值、观测点的几何数据和统计资料的基本统计单元。
目前,随着各种专题图件的制作和各种GIS 系统的建立,直接获取数字图形数据和属性数据的可能性越来越大。GIS 数据共享已成为地理信息系统技术的一个重要研究内容,已有数据的共享也成为GIS 获取数据的重要来源之一。但对已有数据的采用需注意数据格式的转换和数据精度、可信度的问题。
由多媒体设备获取的数据(包括声音、录像等)也是GIS 的数据源之一,目前其主要功能是辅助GIS 的分析和查询。
各种文字报告和立法文件在一些管理类的GIS 系统中,有很大的应用,如在城市规划管理信息系统中,各种城市管理法规及规划报告在规划管理工作中起着很大的作用,所以也成为GIS的数据源。
物联网传感器数据主要包括城市社会物联网大数据和自然环境监测大数据两部分。前一部分主要包括车辆的轨迹数据、智能卡的刷卡数据、手机GPS定位数据等与城市、社会强相关的物联网大数据。后一部分主要来源于各方面的监测数据,如污染物、天气、电网等监测数据。随着机器学习技术的发展,大数据分析的兴起,以网络爬虫为主要获取方式的互联网数据已经成为GIS 的主要大数据来源。

