这篇论文主要探讨了在大数据背景下,特别是地理信息系统(GIS)中的位置数据不确定性问题。在GIS中,数据的不确定性主要源于空间点元和线元的位置不确定性。传统的GIS位置数据不确定性研究通常假设误差分布为正态分布,但实际中,这种假设可能并不准确。论文指出,考虑误差的实际分布模式对于更精确地理解和处理GIS位置数据的不确定性至关重要。
论文首先研究了数字化数据的误差分布及相关问题。通过对点元坐标误差的分析,探讨了在坐标误差相关情况下的位置误差分布密度。此外,论文还讨论了数字化地图纠正的概念模型,包括相似变换、仿射变换和多项式回归模型,以减少系统误差。同时,提出了一种快速生成p-范分布样本的方法,用于误差分布的拟合检验。
接下来,论文深入研究了信息扩散估计(核估计)的理论,提出了扩散估计的最优窗宽的概念和实用算法,解决了确定窗宽这一关键问题。此外,还引入了全局最优窗宽的概念,改进了扩散估计的效果。论文还提出了基于扩散估计的误差分布解析拟合方法,以及基于信息扩散的极大似然估计理论,这种方法能够自动选择最合适的估计方法。
第四章介绍了误差分布的相似度理论,为分布的估计和拟合提供了新的准则,也为定量研究误差分布的相似性、近似性和渐近性提供了理论基础。在第五章中,论文关注GIS位置数据的不确定性度量,提出了在协方差矩阵未知的情况下,利用叠置中的同名点元估计方差的方法,以及叠置层方差分量的极大似然估计方法,特别考虑了统计量的相关性和维希特分布。
论文最后研究了一般分布模式下GIS位置数据误差的传播。通过叠置分析,推导了同名点位置差的分布,探讨了误差扁圆的概念,作为P-范分布下位置误差的统计特性表示,扩展了误差椭圆的理论。这些研究对于理解和处理非正态分布的GIS位置数据误差传播具有重要意义。
这篇论文为GIS位置数据的不确定性研究提供了新的视角和方法,特别是在处理非正态分布的误差时,提出了一系列理论和算法,有助于提高GIS数据处理的精度和可靠性。这些研究成果对于大数据环境下的GIS应用,如城市规划、环境监测、灾害预测等领域具有深远的实践价值。