空间统计分析可包括“空间数据的统计分析”及“数据的空间统计分析”;空间数据的统计分析着重于空间物体和现象的非空间特性的统计分析,解决的一个中心议题就是如何以数学统计模型来描述和模拟空间现象和过程,即将地理模型转换成数学统计模型,以便于定量描述和计算机处理。空间数据的统计分析尽管在分析过程中没有考虑数据抽样点的空间位置,但描述的仍然是空间过程,揭示的也是空间规律和空间机制。
数据的空间统计分析则是直接从空间物体的空间位置、联系等方面出发,研究既具有随机性又具有结构性,或具有空间相关性和依赖性的自然现象。数据的空间统计学与经典统计学的共同之处在于:它们都是在大量采样的基础上,通过对样本属性值的频率分布、均值、方差等关系及其相应规则的分析,确定其空间分布格局与相关关系。数据的空间统计学区别于经典统计学的最大特点是:数据的空间统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离。
空间统计分析与经典统计学的内容往往是交叉的。空间统计分析使用统计方法解释空间数据,分析数据在统计上是否是“典型”的,或“期望”的。同时,它又具有自己独有的空间自相关分析。主要分析内容包含以下几点:
(1)基本统计量:统计量是数据特征的反映,也是统计分析的基础。
(2)探索性数据分析:探索性数据分析能让用户更深入了解数据,认识研究对象,从而对与其数据相关的问题做出更好的决策。探索性数据分析主要包括确定统计数据属性、探测数据分布、全局和局部异常值(过大值或过小值)、寻求全局的变化趋势、研究空间自相关和理解多种数据集之间相关性。
(3)空间插值:基于探索性数据分析结果,选择合适的数据内插模型,由已知样点来创建表面并评估其不确定性,然后研究其空间分布。
(4)空间分类:基于地图表达,采用与变量聚类分析相类似的方法来产生新的综合性或者简洁性专题地图。包括多变量统计分析,如主成分分析、层次分析,以及空间分类统计分析,如系统聚类分析、判别分析等。
(5)空间回归:研究两个或两个以上的变量之间的统计关系,通过空间关系,包括考虑空间的自相关性,把属性数据与空间位置关系结合起来,更好地解释地理事物的空间关系。
空间统计的基本思想是地理学第一定律(FLG): everything is related to everything else, but near things are more related than distant things (Tobler,1970).


