基于多种机器学习模型的西北地区蒸散发模拟与趋势分析_季鹏_2023

基于多种机器学习模型的西北地区蒸散发模拟与趋势分析_季鹏_2023

  • 摘要
    • 关键词
  • 1 资料和方法
    • 1. 1 研究区域与观测数据
    • 1. 2 机器学习模型构建与验证方法
    • 1. 3 SHAP 可解释性方法
  • 2 主要结果
    • 2. 1 不同模型的模拟性能和泛化能力
    • 2. 2 不同模型的可解释性分析
    • 2. 3 5 km 分辨率格点蒸散发数据构建及蒸散发趋势
  • 3 结论

在这里插入图片描述

摘要

  本文利用西北地区 12 个草地通量站点与卫星遥感产品,基于随机森林、极端梯度提升、支持向量回归和人工神经网络 4 种机器学习方法构建 ET 估算模型,制作 5 km 分辨率 ET 产品,并分析 ET 的长期变化趋势。

关键词

西北地区;蒸散发;机器学习;可解释性;趋势分析

1 资料和方法

1. 1 研究区域与观测数据

  本文蒸散发指冠层向上的总蒸散发( ET) ,其计算公式如下:
    ET =Es+Tc。
  其中: Tc 表示冠层蒸腾; Es 表示土壤蒸发。
  本文主要关注我国西北( 包括内蒙古) 干旱、半干旱地区( 图 1a) 。选取由国家青藏高原科学数据中心、FLUXNET2015以及中国陆地生态系统通量观测研究网络提供的 12 个通量站点观测( 图 1b) ,具体站点信息和观测时长见表 1。原始数据频次为半小时、小时或者日,均处理到日尺度。
在这里插入图片描述
在这里插入图片描述

1. 2 机器学习模型构建与验证方法

  本文采用净辐射、日平均气温、日平均湿度等 19 个环境要素作为机器学习模型的预测因子( 详见表 2) 。
在这里插入图片描述
  采用 Python 中的网格搜索和交叉验证函数包( GridSearchCV) 率定 RF、XGB 和 SVR 模型中的部分超参数( 表 3) 。ANN 模型共 4 层,每层神经元的个数分别是 200、100、50 和 1。
在这里插入图片描述
  采 用 Kling-Gupta 系 数、解释方差( R2) 、均方根误差( RMSE) 和偏差( BIAS) 来验证模拟精度,其计算公式如下:
在这里插入图片描述

1. 3 SHAP 可解释性方法

  SHAP 方法是利用博弈论解释机器学习模型的方法 ,其可以量化某个输入要素对模型预测效果的具体贡献。

2 主要结果

2. 1 不同模型的模拟性能和泛化能力

  表 4 给出不同机器学习模型完成 10 次 RCV 和12 次 SCV 后的评估参数,而图 2 给出了 RCV 和SCV 试验在测试集上的验证效果。
在这里插入图片描述
在这里插入图片描述
  图 3 进一步给出了不同站点观测和模型估算的蒸散发季节分布,其中模型估算结果均来自 SCV 试验( 即站点数据均未参与模型训练) ,月尺度结果由日尺度平均得到。
在这里插入图片描述
  总体而言,各模型均能很好模拟出蒸散发的季节循环。然而,没有一种模型能够在每个站点都拥有最好的模拟效果。

2. 2 不同模型的可解释性分析

  图 4 给出了 4 种机器学习模型的 SHAP 可解释性汇总,其中横轴为 SHAP 值,纵轴的预测因子按照解释性大小从上到下依次排列,每个点的颜色代表预测因子的数值大小。

在这里插入图片描述
  图 5 进一步给出净辐射的 SHAP 值和净辐射大小以及土壤湿度之间的关系,选取观测时长最大的AROU 和 NMG 站分别代表高寒草甸和温性草原。
在这里插入图片描述

2. 3 5 km 分辨率格点蒸散发数据构建及蒸散发趋势

  利用上述 4 种机器学习方法构建了西北地区 5 km 分 辨 率2001—2018 年的多模型集合蒸散发产品( 简称 ML_ENS) 。 图6 对比了 ML-ENS 和其他高分辨率产品对不同站点 ET 季节循环的模拟效果。
在这里插入图片描述
  图 7 进一步给出 2001—2018 年西北地区非裸地下垫面的降水、蒸散发以及降水减蒸散发的趋势分布。
在这里插入图片描述

3 结论

  本文以我国西北地区为例,通过 12 个通量站点的多年观测数据训练 4 种机器学习模型,采用随机交叉验证、空间交叉验证和 SHAP 可解性方法检验模型模拟效果与可解释性; 利用具有较好物理可解释性的机器学习模型,结合遥感与格点气象再分析资料生成一套 5 km 分辨率、2001—2018 年蒸散发产品,对蒸散发的长期趋势进行了分析,得到如下主要结论:
  1) RF、XGB、SVR 和 ANN 模型均能很好估算西北地区草地下垫面的日尺度蒸散发,且均具有较好的鲁棒性和泛化能力。基于集成学习理念的 RF和 XGB 模型在随机交叉验证中偏差接近 0,从而拥有比 SVR 和 ANN 模型更小的均方根误差。没有一种模型在所有站点都拥有最好的模拟效果。相比单一模型,4 种模型的集合平均使得蒸散发的季节循环估算误差降低 7% ~20%。
  2) 虽然在具体权重大小上存在差异,4 种机器学习方法均将净辐射作为估算蒸散发的首要因子,同时也都给予植被参数( EVI 或 NDVI) 以及土壤湿度较大的权重,均能合理捕捉干旱、半干旱地区能量、水分和植被对蒸散发的影响。另外,4 种机器学习模型能够合理描述土壤偏干时土壤水分对蒸散发的限制作用。
  3) 基于 4 种机器学习模型集合平均的格点蒸散发产品( ML-ENS) 相比 FLUXCOM、GLEAM 和GLASS 蒸散发产品误差降 低 45% ~ 70%。基 于ML-ENS 产品的趋势分析表明,西北地区( 裸地和沙漠除外) 在 2001—2018 年呈现出蒸散发增加的趋势,且河套、内蒙古中部和东北部地区蒸散发的增加将抵消降水增加的增湿效应,从而进一步增加干旱化风险。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/260967.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux内核解读

来自鹅厂架构师 作者:aurelianliu 工作过程中遇到的调度、内存、文件、网络等可以参考。 1.os运行态 X86架构,用户态运行在ring3,内核态运行在ring0,两个特权等级。 (1)内核、一些特权指令,例…

强化学习(GPS)

GPS——Guided Policy Search引导策略搜索 GPS目前被作为基础算法广泛应用于各种强化学习任务中,其出发点在于纯粹的策略梯度方法在更新参数时不会用到环境模型因而属于一种无模型强化学习算法。由于没有利用任何环境的内在属性,使得其训练只能完全依靠…

【开源】在线办公系统 JAVA+Vue.js+SpringBoot+MySQL

目录 1 功能模块1.1 员工管理模块1.2 邮件管理模块1.3 人事档案模块1.4 公告管理模块 2 系统展示3 核心代码3.1 查询用户3.2 导入用户3.3 新增公告 4 免责声明 本文项目编号: T 001 。 \color{red}{本文项目编号:T001。} 本文项目编号:T001。…

Docker Compose映射卷的作用是什么,dockerfile这个文件有什么区别和联系?

Docker Compose中映射卷(Volumes)的作用和Dockerfile之间既有区别也有联系。下面详细解释两者的作用、区别和联系: Docker Compose映射卷的作用 在Docker Compose中,卷(Volumes)用于数据持久化和数据共享…

沁恒CH32V30X学习笔记11---使用外部时钟模式2采集脉冲计数

使用外部时钟模式2采集脉冲计数 使用外部触发模式 2 能在外部时钟引脚输入的每一个上升沿或下降沿计数。将 ECE 位置位时,将使用外部时钟源模式 2。使用外部时钟源模式 2 时,ETRF 被选定为 CK_PSC。ETR 引脚经过可选的反相器(ETP),分频器(ETPS)后成为 ETRP,再经过滤波…

Excel练习:日历

Excel练习:日历 ‍ 题目:制作日历 ‍ ​​ 用rows和columns函数计算日期单元格偏移量 一个公式填充所有日期单元格 ​​ ‍

PyTorch使用Tricks:学习率衰减 !!

文章目录 前言 1、指数衰减 2、固定步长衰减 3、多步长衰减 4、余弦退火衰减 5、自适应学习率衰减 6、自定义函数实现学习率调整:不同层不同的学习率 前言 在训练神经网络时,如果学习率过大,优化算法可能会在最优解附近震荡而无法收敛&#x…

LDRA Testbed软件静态分析_软件质量度量

系列文章目录 LDRA Testbed软件静态分析_操作指南 LDRA Testbed软件静态分析_自动提取静态分析数据生成文档 LDRA Testbed软件静态分析_Jenkins持续集成_(1)自动进行静态分析的环境搭建 LDRA Testbed软件静态分析_Jenkins持续集成_(2)配置邮件自动发送静态分析结果 LDRA Testb…

Qt C++春晚刘谦魔术约瑟夫环问题的模拟程序

什么是约瑟夫环问题? 约瑟夫问题是个有名的问题:N个人围成一圈,从第一个开始报数,第M个将被杀掉,最后剩下一个,其余人都将被杀掉。例如N6,M5,被杀掉的顺序是:5&#xff…

离线升级esp32开发板升级包esp32-2.0.14(最新版已经3.0alpha了)

1.Arduino IDE 2.3.2最新 2024.2.20升级安装:https://www.arduino.cc/en/software 2.开发板地址 地址(esp8266,esp32) http://arduino.esp8266.com/stable/package_esp8266com_index.json,https://raw.githubusercontent.com/espressif/arduino-esp32…

09MARL深度强化学习policy gradient

文章目录 前言1、Multi-Agent Policy Gradient Theorem2、Centralised State-Value Critics2、Centralised Action-Value Critics 前言 Independent learning算法当中每个智能体看待其他智能体为环境的一部分,加剧了环境非平稳性,而CTDE框架的算法能够降…

HTTP的详细介绍

目录 一、HTTP 相关概念 二、HTTP请求访问的完整过程 1、 建立连接 2、 接收请求 3、 处理请求 3.1 常见的HTTP方法 3.2 GET和POST比较 4、访问资源 5、构建响应报文 6、发送响应报文 7、记录日志 三、HTTP安装组成 1、常见http 服务器程序 2、apache介绍和特点 …

工具分享:在线键盘测试工具

在数字化时代,键盘作为我们与计算机交互的重要媒介之一,其性能和稳定性直接影响到我们的工作效率和使用体验。为了确保键盘的每个按键都能正常工作,并帮助用户检测潜在的延迟、连点等问题,一款优质的在线键盘测试工具显得尤为重要…

QT设置窗口随窗体变化(窗口文本框随窗体的伸缩)

目录 1.建立新窗口2.最终效果 1.建立新窗口 1)在窗体中创建一个 textBrowser,记录坐标及宽高 X-100 Y-130 宽-571 高-281,窗体宽高800*600; 2)在.h头文件中插入void resizeEvent(QResizeEvent *event) override;函数 …

如何系统地自学Python?

如何系统地自学Python? 如何系统地自学Python?1.了解编程基础2.学习Python基础语法3.学习Python库和框架4.练习编写代码5.参与开源项目6.加入Python社区7.利用资源学习8.制定学习计划9.持之以恒总结 如何系统地自学Python? 作为一个Python语…

【MySQL】如何处理DB读写分离数据不一致问题?

文章内容 1、前言读写库数据不一致问题我们如何解决?方案一:利用数据库自身特性方案二:不解决方案三:客户端保存法方案四:缓存标记法方案五:本地缓存标记 那DB读写分离情况下,如何解决缓存和数据…

h5网页和 Android APP联调,webview嵌入网页,网页中window.open打开新页面,网页只在webview中打开,没有重开一个app窗口

我是h5网页开发,客户app通过webview嵌入我的页面 点击标题window.open跳转到长图页面,客户的需求是在app里新开一个窗口展示长图页面,window.open打开,ios端是符合客户需求的,但是在安卓端他会在当前webview打开 这…

Find My资讯|苹果Vision Pro无法通过Find My进行远程定位和发声

苹果 Vision Pro 头显现在已经正式开售,不过根据该公司日前发布的支持文件,这款头显目前缺乏一系列关键查找功能,用户无法在 iCloud 网站或Find My应用中获悉头显的位置,也无法让这款头显远程播放声音。 不过支持文件同时提到 V…

3、windows环境下vscode开发c/c++环境配置(二)

前言:上一篇文章写了windows环境下,配置vscode的c/c开发环境,这一篇讲vscode开发c/c的配置文件,包括c_cpp_propertues.json,task.json及launch.json。 一、总体流程 通过c/c插件我们就可以来编写c/c程序了&#xff0c…

新版AI系统ChatGPT源码支持GPT-4/支持AI绘画去授权

源码获取方式 搜一搜:万能工具箱合集 点击资源库直接进去获取源码即可 如果没看到就是待更新,会陆续更新上 新版AI系统ChatGPT网站源码支持GPT-4/支持AI绘画/Prompt应用/MJ绘画源码/PCH5端/免授权,支持关联上下文,意间绘画模型…