在对地学现象的研究中,地理处理
[1]
方法和软件是必不可少的内容和工具。利用 Python 语言实现
数据与空间处理的整合在地学研究和应用上将提供 更为 高效 的方 法, 大大 节约 了研 究步 骤和 时间 ,
也为实现更多空间分析功能提供了可能。
城镇土地利用的集约程度
[2, 3]
是衡量城镇土地利用合理性的决定性因素。在明确了研究范围和目标
的前提下,城市土地集约利用的含义就是强调土地利用的“效率”最大化
[4]
。基于主成分分析方法
[5-7]
的集约度评价是使用较为广泛的土地评价方法,本文依据主成分分析的原理,使用 Python 脚本语
言中 Numpy 模块和基于 ArcGIS 平台的 Arcpy 模块进行二次编程,读取 并处理文本文件内容、
矢 量 数 据 和 栅 格 数 据 。 本 文 使 用 Numpy 中 的 多 元 统 计 分 析 模 块 和 Arcpy 模 块 主 要 用 于 访 问
ArcGIS 平台地理处理工具和函数的工具包,进行各类空间数据处理与分析
[8-10]
。
1 基于 Python Numpy 模块的统计数据处理方法
评价指标体系的建立应遵循以下原则:主导性原则、整体性原则、层次性原则、易于操作性原则、
易于分析原则
[11]
。根据评价指标体系的建立原则,查找《江苏省统计年鉴 2017》
[12]
,确定了 13
个指标:包括 3 个土地投入的指标(地均固定资产投入 C
1
、单位面积职工数 C
2
、地均财政支出 C
3
)、
4 个土地产出的指标(地均 GDP C
4
、地均工业产值 C
5
、地均财政收入 C
6
、城镇居民人均可支配收
入 C
7
)、4 个利用强度的指标(人均道路面积 C
8
、城镇化率 C
9
、人口密度 C
10
、城镇居民人均住房建
筑面积 C
11
)、2 个反映生态效益的指标(绿地率 C
12
、人均公园绿地面积 C
13
)
[13]
。
1.1 使用 Numpy 进行数据标准化
标准化处理可以解决指标数据之间因为单位不同而不能进行比较的问题,采用均值——标准差(Z-
Score)
[14]
方法对数据进行无量纲化处理,数据标准化表达式为:
Pi,j=Xij−X¯jσjPi,j=Xij−X¯jσj
式中,P
ij
为标准化的数值;X
ij
为第 i 个城镇第 j 个指标值; X
j
为第 j 个指标的平均值; σ
j
为第 j 个指
标的标准差。Z-Score 标准化方法处理结果符合标准正态分布,即结果数据均值为 0,标准差为
1。P
ij
值为正,表示该城镇的第 j 个指标高于平均水平; 反之,则表示该城镇第 j 个指标低于平均
水平。
根据 Z-Score 标准化方法的思想,利用 Numpy 模块在 Python 中构建标准化程序,对比程序与 Z-
Score 方法的数据分析结果,结果一致,说明程序计算结果准确可靠。选取部分指标数据对比如表
1 所示,表中 Z_C
1
、Z_C
2
、Z_C
3
代表 Z-Score 标准化的指标。
1 标准化结果对比表(部分数据)