GIS数据处理(2)
六、空间数据的插值方法
空间数据插值(包括内插和外延)是进行数据外推的基本方法,就是利用已知点的数值来估算其他点的数值过程。对于小样本数据,可以利用地理学相关性原理,产生大批量数据,实现空间数据插值。常用的插值方法很多,分类也没有统一的标准。
例如:从数据分布规律来看,有基于规则分布数据的内插方法,基于不规则分布的内插方法和适合于等高线数据的内插方法等;从内插函数与参考点的关系考虑,又分为曲面通过所有采样点的纯二维插值方法和曲面不通过参考点曲面拟合插值方法;从内插曲面的数学性质来看,有多项式内插、样条内插、最小二乘配置内插等内插函数;从对地形曲面理解的角度,内插方法有克利金法、多层曲面叠置法、加权平均法、分形内插等;从内插点的分布范围,内插方法可分为整体内插、局部内插和逐点内插。……总之,每一种插值方法都有其自身的特点和适用范围,在应用时要注意。
在GIS应用中,空间数据插值方法常常也是GIS邻域和趋势分析的手段。(详见第5章“空间插值实现邻域分析和趋势分析”中介绍)。
七、多源空间数据的整合
在GIS空间数据库中,有空间数据、时间数据和属性数据,为了数据共享,我们可以从空间、时序和管理三个方面对区域数据进行整合。一般原则为:①空间上应按照统一范式的区域划分;② 时间上按时序划分为过去、现在和将来,以便GIS时空动态分析;③ 管理上应依靠通用软件操作的数据要求(具体案例可见第8章)。
RS与GIS的结合具有重要意义。本书曾在第1章中提及,这里再次强调几点:GIS的生命力将最终取决于空间数据库的现势性,遥感数据是GIS的重要信息源和数据更新的手段。同时,RS与GIS的结合可以有效地改善遥感分析。利用GIS的空间数据可以提高遥感数据的分类精度。由于分类可信度的提高,又推动了GIS中数据快速更新的实现。GIS中的高程、坡度、坡向、土壤、植被、地质、土地利用等信息是遥感分类经常要用到的数据。另外,RS与GIS的结合可以进一步加强GIS的空间分析功能。RS与GIS的结合方式通常有三种:①分开但是平等的结合;② 表面无缝的结合;③ 整体的结合。
此外,RS用于GIS地理数据库的快速更新。用卫星影像获取各种地面要素的矢量信息,将遥感图像与GIS空间数据对应的图形以透明方式叠加,并发现和确定需要更新的内容。然后要将栅格数据进行矢量化处理,同时进行一些入库前的预处理。数据就可以按GIS指定的数据结构入库了。
GPS与GIS的结合也具有重要意义。GPS定位准,耗时少,节约人力物力,推动了GIS中数据快速更新的实现。
多元数据集成、加工处理以及建立数据库过程如图4.12所示。

八、大数据时代的GIS
随着云技术的发展,大数据(Big Data)也吸引人们越来越多的关注。大数据分析常和云计算联系到一起。云计算是一种在超大规模的分布式环境中通过共享基础架构,提供计算资源,数据存储和网络服务的新型服务计算模式。大数据特点归纳成表4.5。
表4.5大数据特点
| 特点 | 表现 |
| 数据量大
| 大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。 |
| 类型繁多 | 包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。 |
| 价值密度低 | 如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。 |
| 速度快时效高
| 处理速度快,时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。 |
从目前已有的成熟的GIS技术架构和路线来看,已经无法高效处理如此海量的数据,而对于相关组织来说,如果投入巨大采集的信息无法通过及时处理反馈有效信息,那将是很浪费资源的事。可以说,大数据时代对人类原有的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。

