由于各种空间数据源本身的误差,以及数据采集过程中不可避免的错误,使得获得的空间数据不可避免的存在各种错误。为了“净化”数据,满足空间分析与应用的需要,在采集完数据之后,必须对数据进行必要的检查,包括空间实体是否遗漏、是否重复录入某些实体、图形定位是否错误、属性数据是否准确以及与图形数据的关联是否正确等。数据编辑是数据处理的主要环节,并贯穿于整个数据采集与处理过程。
空间数据采集过程中,人为因素是造成图形数据错误的主要原因。图形数据编辑中经常出现的错误有:

伪节点,当一条线没有一次录入完毕时,就会产生伪结点。伪节点使一条完整的线变成两段。
悬挂节点,当一个节点只与一条线相连接,那么该节点称为悬挂节点。悬挂节点有过头和不及、多边形不封闭、节点不重合等几种情形。
碎屑多边形,碎屑多边形也称条带多边形。因为前后两次录入同一条线的位置不可能完全一致,就会产生碎屑多边形,即由于重复录入而引起。另外,当用不同比例尺的地图进行数据更新时也可能产生。
不正规的多边形,在输入线的过程中,点的次序倒置或者位置不准确会引起不正规的多边形。在进行拓扑生成时,会产生碎屑多边形。
这些错误—般会在建立拓扑的过程中发现。
其它图形数据错误,包括遗漏某些实体、重复录入某些实体、图形定位错误等的检查一般可采用叠合比较法、目视检查法和逻辑检查法等方法进行。
对于检查出的错误,对图形数据编辑是通过向系统发布编辑命令用光标激活来完成的。

属性数据校核包括两部分:一是属性数据与空间数据是否正确关联,标识码是否唯一,不含空值。二是属性数据是否准确,属性数据的值是否超过其取值范围等。属性数据错误检查通常通过逻辑检查和人工校对完成。
在图形修改完毕后,需要对图形要素建立正确的拓扑关系。目前,大多数GIS 软件都提供了完善的拓扑关系生成功能。正如拓扑的定义所描述的,建立拓扑关系时只需要关注实体之间的连接、相邻关系,而节点的位置、弧段的具体形状等。非拓扑属性则不影响拓扑的建立过程。每一个地理信息系统所包含的空间数据都应具有同样的地理数学基础,包括坐标系统、地图投影等。统一的数学基础是运用各种分析方法的前提。

扫描得到的图像数据和遥感影像数据往往会有变形,与标准地形图不符,这时需要对其进行几何纠正。这种纠正主要是建立要纠正的图像与标准的地形图或地形图的理论数值或纠正过的正射影像之间的变换关系,消除各类图形的变形误差。
目前,主要的变换函数有:仿射变换、双线性变换、平方变换、双平方变换、立方变换、四阶多项式变换等,具体采用哪一种,则要根据纠正图像的变形情况、所在区域的地理特征及所选点数来决定。
对于采集完毕的数据,由于原始数据来自不同的空间参考系统,或者数据输入时是一种投影,输出是另外一种投影,造成同一空间区域的不同数据,它们的空间参考有时并不相同,为了空间分析和数据管理,经常需要进行坐标变换,统一到同一空间参考系下。
坐标变换的实质是建立两个空间参考系之间点的一一对应关系。常用的坐标变换的方法有:投影变换、仿射投影、相似变换和橡皮拉伸。目前,大多数GIS 软件是采用正解变换法来完成不同投影之间的转换,并直接在GIS 软件中提供常见投影之间的转换。

重采样是栅格数据空间分析中处理栅格分辨率匹配问题的常用数据处理方法。进行空间分析时,用来分析的数据资料由于来源不同,经常要对栅格数据进行何纠正、旋转、投影变换等处理,在这些处理过程中都会产生重采样问题。因此重采样在栅格数据的处理中占有重要地位。常用的重采样方法有:最邻近像元法、双线性插值法和双三次卷积法。

数据重构主要包括数据结构的转换和数据格式转换。数据结构转换是指矢量和栅格之间的转换,包括,矢量数据向栅格数据的转换,也称为栅格化。栅格数据向矢量数据的转换,也称为矢量化。

GIS 在其发展过程中,出现了很多研究机构和企业,它们所使用的数据格式往往不尽相同。为了实现相互之间的数据和资源共享,需要对数据格式进行转换。数据格式转换是GIS 获取空间数据、共享空间数据的常用手段。
实现数据交换的模式大致有四种,即外部数据交换模式、直接数据访问模式、数据互操作模式和空间共享平台模式。


