没有合适的资源?快使用搜索试试~ 我知道了~
PM2.5浓度空间估算的神经网络与克里格方法对比.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 189 浏览量
2022-11-30
09:28:00
上传
评论
收藏 399KB DOCX 举报
温馨提示
试读
11页
PM2.5浓度空间估算的神经网络与克里格方法对比.docx
资源推荐
资源详情
资源评论
PM
2.5
是城市大气污染的主要污染物之一, 长期暴露在 PM
2.5
高污染水平的环境中会增
加人们罹患心血管、呼吸系统等疾病甚至死亡的风险
[1-2]
, 掌握城市 PM
2.5
浓度的空间分布
特征, 从而有针对性地制定污染防控与风险规避的措施成为当前相关领域研究人员共同关
注的热点。
目前, 国际上普遍通过大气环境定点监测方式获取各城市 PM
2.5
污染状况, 但受污染源
分布、自然条件以及人为活动等因素空间异质性的影响, 各城市内部稀疏监测站点位置观
测数据的空间代表性往往十分有限, 仅能反映该监测站点周围一定范围内的 PM
2.5
污染特征
[3]
。为此, 研究人员引入了地统计、数值模拟、遥感反演、高级统计建模等一系列方法获取
城市 PM
2.5
污染连续空间分布, 以了解其分异规律
[4-8]
。其中, 地统计学估值方法克里格
(Kriging)插值以区域化变量理论为基础, 以变异函数为核心, 在充分利用样本点空间位置信
息的基础上提供了一种简单有效的线性无偏最优估值方法, 成为最早引入该领域也是应用
最为广泛的空间估算方法之一。
随着人工智能领域的飞速发展, 人工神经网络、贝叶斯最大熵估计、随机森林等机器
学习模型因具有较强灵活性、成长性和普适性以及擅长通过学习解决复杂问题的能力, 成
为大气污染物浓度空间模拟的新兴前沿
[9-11]
。其中, 人工神经网络通过从信息处理角度对人
脑神经元网络进行抽象, 建立由大量处理单元互联组成的非线性、自适应、并行分布式的
信息处理系统, 克服了传统机器学习模型在处理非结构化信息方面的缺陷, 在大气污染浓
度预测与空间估算方面已有了较多应用
[9, 12-14]
。
然而, 作为大气污染浓度空间估算机器学习经典方法的人工神经网络与作为地统计方
法重要代表的克里格插值, 在不同数据情景下(如不同样本点数量与耦合因素), 两种方法的
优势是否会随之发生改变, 这些都是高效、准确了解 PM
2.5
污染空间变异特征亟待回答的关
键问题。
本研究结合美国本土 PM
2.5
年均浓度与气象、人口、土地、交通专题数据, 在基于相
关分析与径向基函数(radical basis function, RBF)筛选 PM
2.5
污染空间变异关键影响因素的
基础上, 通过构建和比较不同数据情景下耦合与未耦合决定性影响因素的 RBF 神经网络与
克里格插值方法, 探讨 PM
2.5
空间估算的不同方法在不同数据条件下的适用性, 从而为有效
制定大气污染防控措施、规避污染暴露风险提供科学支持。
1. 研究方法与数据
考虑 PM
2.5
浓度空间分布的平稳特征, 以美国本土为研究区域, 包括 48 个州和哥伦比
亚特区, 位于 67°W~125°W、25°N~49°N 之间。研究包括数据获取与处理、关键因素选
取、模型构建与精度评定 3 个主要步骤(如图 1 所示)。为降低后续实验数据处理与模型构
建难度, 考虑到德克萨斯作为本土面积最大州, 具有丰富土地利用类型, 地势西高东低, 与
研究区整体趋势基本一致, 具有一定代表性。首先, 以德克萨斯州为例对气象、人口、土
地利用、交通等影响因子进行筛选, 确定关键影响因素。然后, 基于美国本土 PM
2.5
数据,
构建不同数据情景下普通克里格插值(ordinary Kriging, OK), 仅以监测站点的地理坐标为变
量的 RBF 神经网络, 以关键影响因素为辅助变量的协同克里格插值(CoKriging, CK), 以及
耦合地理坐标与关键影响因素变量的 RBF 神经网络(称为 CoRBF, 以示区别), 并开展精度
分析对比。在此基础上, 综合考虑监测站点间距离与辅助数据空间分辨率, 选取最优方法
开展研究区全域范围 PM
2.5
浓度的空间分布制图。
图 1 研究设计
Figure 1. Study Design
下载: 全尺寸图片 幻灯片
1.1 数据获取与处理
PM
2.5
浓度数据来源于美国环境保护局(United States Environmental Protection
Agency, EPA), 通过对 2010 年日均数据进行处理求取年均值。美国本土各县人口总数采
自美国人口普查局(US Census Bureau), 结合各县面积计算得到人口密度。气象数据包括
年均温度、湿度、降水和风速, 采自美国国家气候数据中心(National Climatic Data
Center, NCDC)和国家海洋与大气管理局(National Oceanic and Atmospheric
Administration, NOAA)网站。土地利用类型数据源于美国国家地质调查局土地覆盖数据库
(United States Geological Survey, USGS), 并按照需求重分类为水域、居住区、开放空
间、植被覆盖区(包括草地与林地)、湿地与耕地, 空间分辨率为 30 m×30 m。交通数据涵
盖主要街道, 采自 ESRI 公司国家街道与地理编码数据库。
研究区 2010 年有 1 321 个 PM
2.5
监测站, 为方便后续精度评价工作的开展, 以训练样
本比例 5%为起点, 5%为间隔, 逐渐增加样本点数量(至 95%), 研究过程中采用 ArcGIS 子
集要素工具对上述数据随机分为训练样本和检验样本两组。
针对辅助要素, 首先利用 ArcGIS 叠加分析, 以 PM
2.5
监测站为中心, 提取、计算各中
心点 100 m、200 m、300 m、500 m、800 m、1 000 m、1 500 m、2 000 m、2 500
m、3 000 m、3 500 m、4 000 m、4 500 m、5 000 m 范围内道路长度、距最近道路距
离、各土地利用类型面积占比。然后, 对比分析 2010 年美国本土 1 000 个气象监测点气
温、降水量等年均值反距离加权(inverse distance weighted, IDW)、OK 与样条函数 3 种经
典方法的插值精度, 选取十折交叉验证精度最优的 IDW(R
2
: 0.89~0.90)得到气象要素空间
分布, 进而提取监测站点对应数值。最后, 提取监测点对应县级人口密度, 按位置匹配对应
PM
2.5
年均浓度构建数据样本。
1.2 关键因素选取
基于德克萨斯州 54 个监测点的数据样本, 以皮尔逊相关系数为指标, 初步快速筛选出
与 PM
2.5
浓度相关度较大的影响因子。参考相关研究, 认为与 PM
2.5
浓度在 0.01 水平上显
著相关且相关系数大于 0.6 的因素为强相关因素
[9]
。在此基础上, 结合监测站点的地理坐
标, 构建筛选出的强相关因素单个因素与组合因素的 PM
2.5
浓度 RBF 网络, 采用十折交叉
验证定量评价各个模型的精度, 从而实现 PM
2.5
浓度空间变化的关键因素进一步筛选。
1.3 模型构建与精度评定
1.3.1 RBF 构建
RBF 神经网络是一种常见的前馈神经网络, 具有逼近精度高、网络规模小、学习速度
快和全局收敛等优点
[14]
。它由输入层、隐含层和输出层 3 个神经元层组成。每一层都包含
大量互不相连的简单神经元, 输入层神经元一般采用高斯函数将输入数据传递到隐含层,
再由隐含层将数据激活放大后传递到输出层并输出。其中, 高斯函数表达式为:
Ri(x)=exp[−∥x−ci∥22δ2i]Ri(x)=exp[−‖x−ci‖22δi2]
(1)
式中, i=1, 2…m; c
i
为第 i 个基函数的中心; δ
i
为第 i 个感知的变量; ‖x-c
i
‖为(x-c
i
)的范数,
表示 x 与 c
i
间的距离。
首先以地理位置(或地理位置与关键要素)作为输入层, PM
2.5
浓度作为输出层; 然后设
计隐含层, 研究证明 RBF 神经网络能以任意精度逼近任意连续函数, 当隐含层神经元数目
足够多, 具有一个隐含层的 RBF 神经网络就具有较高的精度
[14-15]
。因此本研究采用 3 层模
剩余10页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3895
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功