【分享NVIDIA GTC 23大会干货】通过技术发展平衡看待气候变化数据生产和用户需求[S51358]
- 通过技术发展平衡看待实现气候变化数据的生产和用户需求
- 数字孪生系统和气候信息
- 为什么我们需要用数字孪生系统来适应气候变化呢?
- 要求得不到满足
- 当前未来气候数据来源存在问题
- 那么我们如何从用户的需求开始解决问题呢
- 从需求开始:用户交互
- 用户交互:故事情节
- 用户交互:问题
- 数字孪生系统
- 新一代的气候模型:分辨率
- 运行环境 HPC高性能计算
- 操作环境:可移植性和可伸缩性
- 工作流程:设置和数据流程
- 工作流程:流式算法和单程算法
- 接口
- 人工智能的必要补充作用
- 其他(社会)相关元素
- 参与者和价值观
- 质量控制
- 总结
通过技术发展平衡看待实现气候变化数据的生产和用户需求
气候建模历来是生成未来气候信息以缓解和适应的关键数据来源。然而,气候建模传统上与用户需求脱节,用户发现自己处于漫长生产链的末端。
我们将讨论在生成未来气候信息方面的最新发展如何使用户和建模者之间的关系更加平衡和有效。
数字孪生系统和气候信息
气候适应数字孪生系统是一个支持气候变化适应决策的系统,它在一个允许与用户有互动关系的环境中使用现有的的最佳模型
数字孪生系统需要(非详尽列表):
- 一个收集用户需求的策略
- 一套经过良好验证的可互操作模型
- 操作环境(软件和硬件)
- 一个工作流程战略
- 一个合适的接口
为什么我们需要用数字孪生系统来适应气候变化呢?
要求得不到满足
数字孪生系统出现在一个非常繁忙的背景下,有许多具体的要求,来源杂乱无章,市场不断增长的,需求不断增长,以及定位明确的参与者。所有的需求都得到照顾了吗?信息源的充分性如何?质量和权威性是否得到重视?
答案当然是否定的,例如,对葡萄酒生产商有用的气候信息与不一定适用于风力发电厂管理者。迄今为止,物理气候学界只提供了一套气象变量,而没有充分关注气候信息用户生态系统的不同需求。
当前未来气候数据来源存在问题
虽然与用户互动并产生显著信息的更好方案是必不可少的,但依赖不够好的模型会导致过度自信或信心不足,这反过来又会导致不确定性估计不足和风险评估不够可信。
那么我们如何从用户的需求开始解决问题呢
从需求开始:用户交互
社会科学和人文科学在提供气候信息的服务中发挥着越来越重要的作用。新的和各种各样的办法正在导致同公共行政部门和私营部门建立更有效和成功的联系
用户交互:故事情节
故事情节是物理上自洽的极端物理气候事件及其后果的展开。
用户交互:问题
在特定的情况下,知名零售商需要了解一些特定的极端气候事件对冬季和山地产品销售的影响。(销售对降雪发生、雨后降雨、最高气温、土壤状况等综合因素敏感。)
数字孪生系统
新一代的气候模型:分辨率
富含涡流的风暴解析模型(10公里或更高分辨率)模拟了北大西洋海温偏差的减小(右)和21世纪墨西哥湾流的北移,导致欧洲降雨增加(左),这是传统低分辨率模型所没有发现的。
有一些替代方案可以降低全球气候模式模拟的成本,例如使用随机参数化,在传统模式中对未解决过程进行更真实的物理参数化,或使用基于机器学习的模拟器。然而,在所有情况下,我们都需要一个可信的未来气候轨迹,而这只能由更复杂的(通过更高分辨率或更好的物理过程表示)模型提供。然后,可以通过更简单的(基于人工智能或基于低分辨率流程的)模型来模拟该轨迹(并产生更大的集成)。
运行环境 HPC高性能计算
欧洲高性能计算计划提供计算时间(5%)在新的HPC超级计算机上,MareNostrum(上)和LUMI(下)。专用的存储和数据处理平台具有专用的带宽。此外还有大量基于云的、可扩展的数据处理解决方案,以及足够的分级存储。
操作环境:可移植性和可伸缩性
新的硬件,全球公里级分辨率,精度更高,提高计算效率和优化所有任务的行动,包括新的气候模式
- 确保机器被有效地使用
- 开发具有可复制性,计算效率和代码质量等可衡量指标的测试
- 使用新的GPU分区内核和数据结构来加速新模型
工作流程:设置和数据流程
流式概念是数字孪生的基础,因为它允许用户在有限的时间内获得完整的模型状态向量(标准化),以生成前所未有的预测。预测的产生是连续的,集合成员是交错的。一个(5公里)会员需要大约45天的挂钟时间(使用大约10万个核心)。
工作流程:流式算法和单程算法
流媒体概念是数字孪生体的关键,因为它允许用户以高频率和原生分辨率(km)访问完整的模型状态向量。
单程算法是数据还原任务,从流数据中计算(不断更新)汇总统计数据或后处理参数。
计算例如高频率(小时)数据(如移动的的热带气旋下的海洋特征)或在线偏差调整数据的统计数据。:
接口
接口的作用是让用户访问海量的数据,接口需要灵活,甚至可以包括基于生成式人工智能的工具,这些人工智能接受了数字孪生系统产生和收集的数据的训练。
在《银河系漫游指南》中,一群人要求了解“关于生命、宇宙和一切的终极问题的答案”。超级计算机“深思”花了750万年来计算答案,也就是42年。计算机意识到答案是没有意义的。这与我们的案例相关,因为答案是:
- 非语境化的
- 不合格
- 不合时宜
- 不可追溯
接口类型为一个
•复杂但传统的门户网站(C3S)
•以对话方式参与的训练模型(ChatGPT)
但是,该界面至少应该包含
•根据服务标准提供互动性、针对性和可追溯性的产品
•培训(网络研讨会、研讨会、慕课)和指导
•质量保证
•面向用户的影响评估
人工智能的必要补充作用
一个基于ml的天气预报模型可以在一个(最好是几个)基于过程的气候模型(具有高频输出)的轨迹上进行训练。模型重新启动可以用于几乎立即(在推断模式下)重新创建任何用户要求的模型输出,以实现真正的交互性。
基于ml的模型可以提供降尺度(超分辨率)、目标(用户指标)和偏差调整的大集合数据(如果不确定性处理是可信的)。它是否能够模拟基于过程的气候模式尚未探索的排放情景的影响是有争议的。
我们需要将地球环流模型和人类活动的影响结合起来。这是2050年后气候的最大不确定性来源,而前者(增加了大气和海洋化学等额外成分)是将这些强迫的影响传播到未来所必需的。在这种情况下,人工智能可以从许多不同的角度对数字双胞胎的模拟部分进行极好的补充:模拟一些模型参数化或模拟未来的模拟轨迹。
其他(社会)相关元素
- 不确定性:在信息表述中包括所有可能的来源,以获得可信的不确定性估计(可信度)。
- 标准程序:标准在气候方面不像人们预期的那样普遍(合法性)。
- 质量控制:基于社区标准(和认证)、透明度和可重复性/可复制性的质量控制(特别是面向用户的)在研究中经常缺失,有时也在运营环境中缺失(可信度和合法性)。
- 解释和沟通:用户通常不是专家,提供适当的上下文可以避免误用和误解(突出性)。
•综合和服务:如何处理信息构建和传递中的多条证据线(突出性和合法性)。
参与者和价值观
流概念是数字孪生中的关键,因为它允许用户以高频率和原始分辨率(5公里)获得完整的模型状态矢量。
质量控制
评价和质量控制支持信任和标识可用性障碍使产品有用,但适合用途应该是不可分割的一部分。
总结
在“目的地地球”倡议和几个国家和欧洲研究项目的框架内,一个适应气候变化的数字孪生系统正在建设中。
- 数字孪生系统的目标是完全重新审视迄今为止在CMIP和CORDEX存在的背景下提供气候信息的方式,旨在让用户掌握主动权。
- 只有在不同相关领域在真正的多学科环境中共同工作的真诚意愿下,这才能实现。