PM2.5浓度空间估算的神经网络与克里格方法对比.docx

版权申诉

189 浏览量 2022-11-30 09:28:00 上传评论收藏 399KB DOCX 举报

资源推荐

资源详情

资源评论

2.5

是城市大气污染的主要污染物之一, 长期暴露在 PM

2.5

高污染水平的环境中会增

加人们罹患心血管、呼吸系统等疾病甚至死亡的风险

[1-2]

, 掌握城市 PM

2.5

浓度的空间分布

特征, 从而有针对性地制定污染防控与风险规避的措施成为当前相关领域研究人员共同关

注的热点。

目前, 国际上普遍通过大气环境定点监测方式获取各城市 PM

2.5

污染状况, 但受污染源

分布、自然条件以及人为活动等因素空间异质性的影响, 各城市内部稀疏监测站点位置观

测数据的空间代表性往往十分有限, 仅能反映该监测站点周围一定范围内的 PM

2.5

污染特征

[3]

。为此, 研究人员引入了地统计、数值模拟、遥感反演、高级统计建模等一系列方法获取

城市 PM

2.5

污染连续空间分布, 以了解其分异规律

[4-8]

。其中, 地统计学估值方法克里格

(Kriging)插值以区域化变量理论为基础, 以变异函数为核心, 在充分利用样本点空间位置信

息的基础上提供了一种简单有效的线性无偏最优估值方法, 成为最早引入该领域也是应用

最为广泛的空间估算方法之一。

随着人工智能领域的飞速发展, 人工神经网络、贝叶斯最大熵估计、随机森林等机器

学习模型因具有较强灵活性、成长性和普适性以及擅长通过学习解决复杂问题的能力, 成

为大气污染物浓度空间模拟的新兴前沿

[9-11]

。其中, 人工神经网络通过从信息处理角度对人

脑神经元网络进行抽象, 建立由大量处理单元互联组成的非线性、自适应、并行分布式的

信息处理系统, 克服了传统机器学习模型在处理非结构化信息方面的缺陷, 在大气污染浓

度预测与空间估算方面已有了较多应用

[9, 12-14]

。

然而, 作为大气污染浓度空间估算机器学习经典方法的人工神经网络与作为地统计方

法重要代表的克里格插值, 在不同数据情景下(如不同样本点数量与耦合因素), 两种方法的

优势是否会随之发生改变, 这些都是高效、准确了解 PM

2.5

污染空间变异特征亟待回答的关

键问题。

本研究结合美国本土 PM

2.5

年均浓度与气象、人口、土地、交通专题数据, 在基于相

关分析与径向基函数(radical basis function, RBF)筛选 PM

2.5

污染空间变异关键影响因素的

基础上, 通过构建和比较不同数据情景下耦合与未耦合决定性影响因素的 RBF 神经网络与

克里格插值方法, 探讨 PM

2.5

空间估算的不同方法在不同数据条件下的适用性, 从而为有效

制定大气污染防控措施、规避污染暴露风险提供科学支持。

1. 研究方法与数据

考虑 PM

2.5

浓度空间分布的平稳特征, 以美国本土为研究区域, 包括 48 个州和哥伦比

亚特区, 位于 67°W~125°W、25°N~49°N 之间。研究包括数据获取与处理、关键因素选

取、模型构建与精度评定 3 个主要步骤(如图 1 所示)。为降低后续实验数据处理与模型构

建难度, 考虑到德克萨斯作为本土面积最大州, 具有丰富土地利用类型, 地势西高东低, 与

研究区整体趋势基本一致, 具有一定代表性。首先, 以德克萨斯州为例对气象、人口、土

(United States Geological Survey, USGS), 并按照需求重分类为水域、居住区、开放空

间、植被覆盖区(包括草地与林地)、湿地与耕地, 空间分辨率为 30 m×30 m。交通数据涵

盖主要街道, 采自 ESRI 公司国家街道与地理编码数据库。

研究区 2010 年有 1 321 个 PM

2.5

监测站, 为方便后续精度评价工作的开展, 以训练样

本比例 5%为起点, 5%为间隔, 逐渐增加样本点数量(至 95%), 研究过程中采用 ArcGIS 子

集要素工具对上述数据随机分为训练样本和检验样本两组。

针对辅助要素, 首先利用 ArcGIS 叠加分析, 以 PM

2.5

监测站为中心, 提取、计算各中

心点 100 m、200 m、300 m、500 m、800 m、1 000 m、1 500 m、2 000 m、2 500

m、3 000 m、3 500 m、4 000 m、4 500 m、5 000 m 范围内道路长度、距最近道路距

离、各土地利用类型面积占比。然后, 对比分析 2010 年美国本土 1 000 个气象监测点气

温、降水量等年均值反距离加权(inverse distance weighted, IDW)、OK 与样条函数 3 种经

典方法的插值精度, 选取十折交叉验证精度最优的 IDW(R

: 0.89~0.90)得到气象要素空间

分布, 进而提取监测站点对应数值。最后, 提取监测点对应县级人口密度, 按位置匹配对应

2.5

年均浓度构建数据样本。

1.2 关键因素选取

基于德克萨斯州 54 个监测点的数据样本, 以皮尔逊相关系数为指标, 初步快速筛选出

与 PM

2.5

浓度相关度较大的影响因子。参考相关研究, 认为与 PM

2.5

浓度在 0.01 水平上显

著相关且相关系数大于 0.6 的因素为强相关因素

[9]

。在此基础上, 结合监测站点的地理坐

标, 构建筛选出的强相关因素单个因素与组合因素的 PM

2.5

浓度 RBF 网络, 采用十折交叉

验证定量评价各个模型的精度, 从而实现 PM

2.5

浓度空间变化的关键因素进一步筛选。

1.3 模型构建与精度评定

1.3.1 RBF 构建

RBF 神经网络是一种常见的前馈神经网络, 具有逼近精度高、网络规模小、学习速度

快和全局收敛等优点

[14]

。它由输入层、隐含层和输出层 3 个神经元层组成。每一层都包含

大量互不相连的简单神经元, 输入层神经元一般采用高斯函数将输入数据传递到隐含层,

再由隐含层将数据激活放大后传递到输出层并输出。其中, 高斯函数表达式为:

Ri(x)=exp[−∥x−ci∥22δ2i]Ri(x)=exp[−‖x−ci‖22δi2]

(1)

式中, i=1, 2…m; c

为第 i 个基函数的中心; δ

为第 i 个感知的变量; ‖x-c

‖为(x-c

)的范数,

表示 x 与 c

间的距离。

首先以地理位置(或地理位置与关键要素)作为输入层, PM

2.5

浓度作为输出层; 然后设

计隐含层, 研究证明 RBF 神经网络能以任意精度逼近任意连续函数, 当隐含层神经元数目

足够多, 具有一个隐含层的 RBF 神经网络就具有较高的精度

[14-15]

。因此本研究采用 3 层模

剩余10页未读，继续阅读

评论收藏

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3895
资源: 1万+

PM2.5浓度空间估算的神经网络与克里格方法对比.docx

大气中PM2.5浓度的空间表征方法研究.docx

不同出行方式交通空间颗粒物浓度特征及人体摄入量估算方法研究.docx

综述指示克里格方法的原理与应用.docx

基于GPU的DEM并行克里格插值算法.pdf

GS+7.0地统计和ARCGIS克里格插值过程.doc

MATLAB克里格工具箱中文翻译版.docx

克里格空间插值法.ppt

综述指示克里格方法的原理及应用.doc

克里格方法内插生成GDP 区域分布图10.pdf

论文研究-高山流域降水无线传感器网络节点布局优化方法.pdf

myhist.rar_Matlab 克里格_cokriging_克里格_协同克里格_变差函数

基于智能优化算法的套和模型克里格空间插值

matlab克里金插值kriging.rar_Matlab ，克里格_克里格插值_克里金_克里金算法_地下水

克里格插值

二次曲面模型与克里格模型在GPS高程转换中的应用.pdf

R语言空间插值

C++实现克里金插值，有实现界面，包括反距离加权插值、最邻近点插值方法.

广义回归神经网络残余Kriging方法预测地表高程 (2010年)

论文研究 - 基于GIS的伊拉克西南AL-Salman地区地下水位估算空间插值方法的比较和评估

地统计学中的克里格插值法，Matlab编写，内有详细的说明.rar

克里格插值法

相关实用应用程序（Windows可用）

李飞飞自传 我看见的世界 The World I see

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

第十九届研电赛-技术论文模板

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

智联招聘：2024年大学生就业力调研报告.pdf

最新资源

李飞飞自传我看见的世界 The World I see