没有合适的资源?快使用搜索试试~ 我知道了~
基于光谱-环境随机森林回归模型的MODIS积雪面积比例反演研究.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 168 浏览量
2023-02-23
20:19:29
上传
评论
收藏 464KB DOCX 举报
温馨提示
试读
22页
基于光谱-环境随机森林回归模型的MODIS积雪面积比例反演研究.docx
资源推荐
资源详情
资源评论
0 引言
积雪是冰冻圈重要的组成要素之一,是气候变化的指示器。积雪面积作为
积雪的一个重要特征,对于区域水文、地表能量过程具有重要的意义
[ 1-3]
。遥
感积雪面积数据由于覆盖面积大,时空分辨率较高,已被广泛应用在积雪面积
的反演研究中
[ 4]
。遥感积雪面积数据主要分为二值积雪面积数据和积雪面积
比例数据。二值积雪面积数据反演的精度与雪深、地形和地表类型密切相关,
研究表明斑状分布的积雪、山区或林区分布的积雪,由于混合像元的影响,二
值积雪面积数据很难反映积雪分布特征
[ 5-7]
。FSC 数据用像元内积雪覆盖的比
例来表示积雪覆盖的面积
[ 8]
,可以在亚像元尺度上定量描述像元内积雪的覆
盖程度,相比于二值积雪面积数据可以更加准确地估计积雪覆盖面积
[ 9-10]
。
MODIS FSC 比例数据已经取代二值积雪面积数据作为许多水文和大气模
型的重要输入参数
[ 11-13]
。目前,MODIS FSC 的提取方法主要包括三种:线性
回归模型、混合像元分解模型和机器学习模型。线性回归模型主要是利用 FSC
和与其相关的指数[如归一化植被指数(Normalized Difference Vegetation
Index , NDVI ) 、 归 一 化 积 雪 指 数 ( Normalized Difference Snow Index ,
NDSI)等]间的线性关系构建回归模型,许多学者都做了大量的研究
[ 14-16]
。
代 表 性 研 究 成 果 主 要 是 Salomonson 等
[ 16 ]
构 建 的 线 性 回 归 模 型
(FSC_NDSI),该模型被 NASA 的 MODIS 全球积雪覆盖产品所采用。混合
像元分解模型主要是选择图像端元,通过线性光谱混合分析模型(LSMA)进
行解混以获取 FSC。代表性研究主要包括:Painter 等
[ 17]
结合 LSMA 模型和
积 雪 辐 射 传 输 模 型 发 展 了 一 种 针 对 MODIS 数 据 的 FSC 提 取 的 算 法
MODSCAG;施建成
[ 18]
发展了一种改进“多端元光谱混合分析”方法反演 MODIS
FSC,该算法通过对 MOD09GA 数据进行图像端元自动提取,并利用能够代
表图像端元类的典型端元库进行“多端元光谱混合分析”反演 FSC 数据;Zhao
等
[ 19 ]
考虑地表类型信息对 FSC 提取的影响,提出了一种基于空间光谱环境
(SSE)信息的端元提取算法,并结合 LSMA 模型提取 MODIS FSC 的算法
(SSEmod)。机器学习也是目前获取 MODIS FSC 的新方法,其中代表性研
究包括:Dobreva 等
[ 20 ]
首次利用人工神经网络(ANN)模型来反演 MODIS
FSC,取得了良好效果;Czyzowsk 等
[ 21]
、Hou 等
[ 22-23]
在此基础上考虑了地
形、温度、海拔、地表覆盖类型等环境信息,有效地提高了 MODIS FSC 数据
制备的精度。以上研究表明,机器学习方法能够有效地反演 FSC,进一步结合
环境信息,可以提高 FSC 的反演精度。
综合提取 MODIS FSC 的三种常用方法,线性回归模型物理意义明确,易
于实现,但仅仅考虑 NDSI 与 FSC 之间的关系,忽略了地形、地表类型等环
境信息对 FSC 提取的影响。混合像元分解模型通过考虑地表类型信息可以有
效提高积雪识别精度,但在地形复杂、地表覆盖类型多样的地区仍然会高估或
者低估积雪覆盖面积,需引入更多影响积雪识别的环境信息,使算法在估计积
雪覆盖面积上有更好的精度
[ 24]
。相比线性回归模型和混合像元分解模型,机
器学习模型结合环境信息(地形、地表覆盖类型)在高山区反演 FSC 具有更
高的精度
[ 22-23]
,但利用 ANN 模型处理高维数据的回归问题时收敛速度慢且易
造成过拟合
[ 25]
。已有研究表明
[ 26]
,相较于支持向量机(Support Vector Machine,
SVM)和 ANN 模型,随机森林(Random Forest)在山区积雪面积提取中更
加准确,具有良好的鲁棒性。在以往利用随机森林模型反演 FSC 的研究
[ 26-27]
中,特征数据的选择多集中于地表反射率、积雪指数、DEM 等信息,忽略了
地形、地表温度、地表覆盖类型等环境信息对 FSC 提取的影响。
因此,本研究利用随机森林回归(Random Forest Regressor)模型易于
架构、抗噪性能强、防止过拟合的优点,引入了成像角度(观测角度)、地形、
地表覆盖类型、地表温度、降雪等环境信息,构建了的光谱-环境随机森林回
归模型(Spectral Environment Random Forest Regressor,SE-RFR)并用于
中国区域 FSC 反演。并利用 Landsat 8 地表反射率数据生成的 FSC 对其进行
了精度评估,分析了环境信息的引入对随机森林回归模型提取 FSC 的作用,
并且与三种 MODIS FSC 反演算法(FSC_NDSI、MODSCAG、SSEmod)获
取的 FSC 数据进行了对比,客观地描述 SE-RFR 模型的反演精度。
1 数据及预处理
本研究中主要使用 MOD09GA 地表反射率数据、MCD12Q1 地表类型数据、
ERA5-Land 再分析数据、SRTM 数字高程数据和 Landsat 8 地表反射率数据。
MOD09GA、MCD12Q1、ERA5-LAND 和 SRTM 数据主要用于提取随机森林
回归模型的输入数据。Landsat 8 地表反射率数据用于制备“真值”FSC,一部
分用作模型的输入数据,另一部分作为验证数据,来对模型进行精度评估。以
上输入数据在输入 SE-RFR 模型前需采用 min-max 标准化法进行归一化处理,
以避免方差过大的特征对机器学习算法造成影响
[ 28]
,所有输入数据需选取与
Landsat 8 数据时间、空间范围一致的影像数据,并采用与 Landsat 8 影像一
致的投影系统将其重投影。
1.1 MOD09GA
MOD09GA 逐 日 地 表 反 射 率 数 据 源 于 NASA ( https :
//search.earthdata.nasa.gov),空间分辨率为 500 m,正弦投影且已经过大
气校正。该数据是本研究的主要数据源,输入数据包括七个通道地表反射率数
据(b01-b07),太阳天顶角、太阳方位角、传感器天顶角、传感器方位角四
个角度数据 和 NDVI、NDSI、归一化 林地 积雪 指数(Normalized Difference
Forest Snow Index, NDFSI) 三个 指数 数 据。 在提 取输 入数据 前, 需利 用
MOD09GA 的质量评估 QA 提供的云掩膜信息来去除云像元,以免对模型训练
造成影响。
1.2 MCD12Q1
MCD12Q1 地表覆盖类型数据
[ 29]
来源于 NASA,空间分辨率为 500 m,
正弦投影,可以提供逐年全球地表覆盖类型数据,数据覆盖时间自 2001 年至
2019 年,包含 13 个科学数据集,5 个分类标准(IGBP,UMD,LAI,BGC,
PFT)。本研究中使用了国际地圈-生物圈计划(IGBP)分类标准的地表类型
数据,共包含 17 种地表类型,从 1 到 9 的 IGBP 代码被视为代表林冠高度超
过 2 m 且树木覆盖率高于 30%的森林区域,而其他 IGBP 代码被归类为非森林
区域。该数据是随机森林回归模型输入数据中的重要环境信息,用于区分森林
与非森林区域,同时也用来评估 FSC 数据在不同地表覆盖类型下的精度。
1.3 ERA5-Land 与 SRTM 数字 高 程 数 据
ERA5-Land 再 分 析 数 据 源 于 哥 白 尼 气 候 数 据 库 ( Copernicus Climate
Data Store),时间分辨率为 1 h,空间分辨率为 0.1 rad,GLL 经纬度投影,
数据覆盖时间自 1981 年 1 月至 2021 年 5 月。本研究主要利用该数据集中的
地表温度和降雪数据作为随机森林回归模型的输入数据。MODIS Terra 在当地
上午过境,为了将再分析资料与卫星观测数据相匹配,本研究中地表温度数据
为当日 12:00 前的平均地表温度,降雪数据为当日 12:00 前的累积降雪。
SRTM 数字高程数据源于 NASA,空间分辨率为 90 m,WGS 84 投影,主要
用于提取高程数据,并基于高程数据采用 4 邻域法计算坡度、坡向。
1.4 Landsat 8 地表反 射 率 数 据
Landsat 8 地表反射率数据由美国地质调查局(United States Geological
Survey,USGS)提供,已经过大气校正,空间分辨率为 30 m,时间分辨率
为 16 d,WGS84 UTM 投影。本数据主要用于制备 Landsat 8 FSC 数据(L8-
FSC)。 制 备 L8-FSC 时先 根据 Wang 等
[ 30 ]
开发 改进的 SNOMAP 算 法从
Landsat 8 地表反射率数据中提取积雪二值影像,改进的 SNOMAP 算法采用
NDVI、NDSI 和 NDFSI 相结合的方法来提取积雪像元。然后将 30 m 的积雪二
值数据聚合成分辨率为 500 m 的 FSC 数据
[ 7]
。聚合公式由式(1)给出。
FSCi=sn=∑j=1s1[500/30]2FSCi=sn=∑j=1s1[500/30]2
(1)
式中:[ ]表示取整;n 表示一个 500 m 分辨率像元内 30 m 分辨率像元
的个数;s 表示一个 500 m 分辨率像元内 30 m 分辨率积雪像元的个数。
本研究在 2014―2020 年积雪期(本年 11 月 1 日至次年 3 月 31 日)期间
共选取了中国区域内的 32 景 Landsat 8 地表反射率影像数据来制备 L8-FSC。
选取原则:影像数据无云(云覆盖率小于 2%)且积雪覆盖率在 30%~90%之
间。其中,20 景影像用于 SE-RFR 模型的训练,约有 230 多万个有效像元;12
景影像用于验证 SE-RFR 模型的准确性,约有 130 多万个有效像元。其中训
剩余21页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3538
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功