空间查询及数据探查
一、空间查询
空间查询是指从GIS数据库中获取用户咨询的数据,并以一定的形式提供给用户。有时地理空间查询也涉及简单的几何计算(如距离和面积)或地理实体的重新分类(将在第5章“基于矢量数据的GIS分析”中介绍)。
数据库查询要采用一定查询语言实现用户与数据库系统的接口,常用的查询语言为SQL,具有如下的语法形式:
Select 《目标标识序列》 From 《数据库》 Where《查询条件》
SQL查询语言包括三部分内容。
1.数据定义DDL(Data DefinitionLanguage )
实现数据表、数据视图的框架定义,建立索引。
2.数据管理DML (Data Manipulation Language)
实现数据的追加、删除、插入、维护等数据管理。
3.数据控制DCL (Data Control Language)
实现事务、进程管理,对安全性进行控制。
通用的SQL查询语言与空间概念集成后产生了空间SQL查询语言,促使数据类型从简单的整数、小数、字符等扩展为点、线、多边形、复杂线、复杂多边形等复杂的空间数据类型,,查询的操作谓词也扩展到针对空间数据的处理。在OGIS、SQL3等空间查询的标准中,针对空间问题的查询操作可以归纳为三类(Shekhar and Chawla 2002):
(1)几何操作,诸如空间参考系确立、外接矩形生成、边界提取等。
(2)拓扑操作,包括对相等、分离、相交、相切交叉、包含等拓扑关系的布尔判断。
(3)空间分析操作,包括缓冲区生成、多边形叠置、凸壳生成等。
二、数据探查
在GIS项目中,对GIS 数据库中的海量数据进行分析的捷径定义为数据探查。用户或研究者可以通过数据探查(DataExploration)事先了解一些数据的总趋势以及数据间可能存在的关系,以便更好地挖掘理解数据,为系统地阐明研究问题和设想提供前提。
无论基于矢量还是基于栅格地图,图表统计和表格在多视窗口中显示并动态链接,都可视为数据探查的内容,所以,数据探查的一个重要组成部分为交互式、动态链接的可视化(有关可视化问题将在第7章介绍)。
传统上,为探索数据结构和发现数据类型主要用统计方法中的差距、中值、平均值、方差、标准差以及图表等来描述,。
1. 差距(Range):最大与最小之间的差值。
2. 中值(Median):中间点的值。
3. 平均值(Mean):数值的平均。
4. 方差(variance):每个数据值与平均值的差的平方的平均值。
5. 标准差(StandardDeviation):方差的平方根。
基于一定软、硬件环境下的GIS软件包可以同时进行地图、统计图和表格的使用,适合作数据探查。GIS中的数据探查虽类似于统计学中的数据分析,但有区别。表现在:第一,GIS数据探查包括对空间数据与属性数据探查,空间数据是新的数据探查;第二,GIS数据探查的表达主要是地图和地图特征可视化。

