国家海洋环境预报中心李本霞:全国首个海浪智能预报系统已投入业务化运行,AI助力海浪预报多项突破

近日,在第 20 届 CCF HPC China 2024 大会中,第六届海洋数值预报与高性能计算论坛圆满举办。在本次大会上,国家海洋环境预报中心海浪预报室主任李本霞以「人工智能在海浪预报中的应用」为主题展开演讲, HyperAI超神经在不违原意的前提下,整理了该演讲的核心内容,以下为演讲实录。

在这里插入图片描述

AI 助力,海浪智能预报已成行业发展趋势之一

我国是全球海浪灾害较为严重的国家之一,海浪预报在维护海上活动安全、促进经济发展和保护海洋环境方面发挥着不可或缺的作用。 例如,在海上安全方面,海浪预报能够帮助渔民规避恶劣海况,确保海上作业的安全;对滨海旅游而言,海浪预报能够提前警示游客,避免在危险海域发生事故;在海洋能源开发领域,其为海上风电和潮汐能设施的设计和维护提供了重要参考。

中国的海浪预报始于 1965 年,最初主要依赖于经验统计预报。而后,随着海外数值预报模式的引进和我国自主模式的开发,我们逐步建立了覆盖中国近海及西太平洋、浴场海浪业务化数值预报系统。进一步地,人机交互平台和海洋智能网格预报技术也日益成熟。

在这里插入图片描述

从预报技术的发展来看,目前海浪的数值预报模式仍然是主流。然而,面对沿海地区的台风灾害时,由于台风路径的不确定性,台风路径和强度预报需要快速更新,这要求海浪预报能够迅速响应这些变化。但海浪数值预报模式需要经过人工经验订正、人机平台交互、产品发布等流程,无法快速响应需求。此外,其高计算成本也是一大约束。

在这里插入图片描述

近年来,随着人工智能和算力技术的不断进步,智能预报日益成熟,此外,过去的海浪数值预报积累了大量的训练数据,也为海浪智能预报的发展提供了重要的基础支撑。在这种情况下,海浪智能预报以其用时短、简单便捷、预测精度高的特点脱颖而出。

海浪智能预报实践,1 分钟即可完成 72-96 小时的预报

智能预报技术主要利用深度学习方法来模拟数值和人工经验预报过程,进而建立海浪要素智能预报模型,并结合云计算与边缘计算技术,构建轻量化快速预报系统。

海浪智能预报可以序列化并行输出海浪各时次预报结果。与传统物理模型相同,可以直接利用 T0-m 至 T0+n 时刻的风场序列,来预测 T1 至 T0+n 时刻的浪场序列。

在这里插入图片描述

其次,海浪智能预报能够更直接有效地利用观测信息,比如,将中国近海浮标数据、卫星海浪遥感数据等观测数据融合到海浪数值分析场中,这种订正技术可以提高用于训练的分析场精度,进而提高预报结果。

最后,相较于海浪数值预报模式,海浪智能预报能够显著减少计算时间,仅需 1 分钟即可完成 72-96 小时的预报。

订正训练数据,提升海浪预报精度

在构建海浪智能预报产品方面,李本霞提到,其团队曾开发了一套中国近海及西北太平洋海浪智能预报产品。所用训练数据如下图所示, 主要使用了欧洲中期天气预报中心 (ECMWF) 发布的第五代大气再分析数据 ERA5、美国国家环境预测中心 (NCEP) 发布的全球气候再分析数据 ,以及欧洲中期天气预报中心的 (ECMWF) 海浪分析场数据、国家海洋环境预报中心 (NMEFC) 自主研制的海浪分析场数据等。

在这里插入图片描述

值得注意的是,在海浪训练数据研制过程中,该团队特别关注了在大气层结不稳定的情况下,风能输入项可能会出现明显偏小的现象,自主发展了一种基于海气温差的海浪有效波高订正方法,可以显著提升海浪模拟精度,改善浅水海域海浪预报偏小的问题。

具体而言,研究人员沿中国近海从北向南选择了数十个近海业务化海浪观测浮标,并融合北印度洋区域的卫星数据进行订正,将观测数据通过最优插值融合进入海浪数值分析场中。

在这里插入图片描述

在具体应用中,研究人员还对海洋二号 C 星等有明显系统偏差的数据进行了融合场订正。结果显示,融合场在系统偏差、均方根误差、相对误差以及 Scatter Index 方面,都在全波高内有了明显的改善,具有较高实时性,可提升数值模式场的精度。

在这里插入图片描述

首个业务化运行的海浪智能预报系统问世,已通过专家评审

基于上述数据,李本霞团队用深度学习方法 Vision Transformer 等开发了一套中国近海及西北太平洋海浪智能预报系统。这是我国首个投入业务化运行的海浪智能预报系统,已于 2022 年 6 月通过专家评审。

在这里插入图片描述

值得一提的是,Vision Transformer 是一种专门处理序列数据的神经网络架构,作为当前领先的深度学习架构之一,可以捕捉长距离的依赖关系,解决传统 RNN 在处理长序列时的难题。它还可以同时处理序列中的所有元素,从而支持高度并行化的计算,模型训练速度显著加快。

在这里插入图片描述

如下图所示,在海浪平均周期预报中,从空间分布特征来看,这套海浪 AI 智能预报与欧洲 ECMWF 业务化海浪数值预报结果非常一致。

在这里插入图片描述

在误差随预报时效变化方面,海浪 AI 智能预报与 ECMWF 业务化海浪数值预报精度相当。如下图所示,将观测数据进行融合来订正训练数据,海浪预测的效果更好(黄线),这说明对观测数据进行融合订正在海浪预测中是必要的。

在这里插入图片描述

此外,在误差随波高变化方面,海浪 AI 智能预报在有效波高 4m 以上的预报结果明显偏小。

在这里插入图片描述

为了改善台风等导致的强海况过程预报偏小的问题,研究团队精心挑选了 2021 至 2023 年中国近海台风过程的风场、浪场构建学习样本。研究结果表明,增加台风过程的学习样本可以提高智能模型对大浪过程的预报精度,台风浪越大,提高的精度越多,且对台风中心附近大浪区的预报更平滑。

在这里插入图片描述

硕果累累,海浪智能预报迎来崭新时代

此外,研究团队针对印度洋南部和北部浪场分别由风浪和涌浪主导的特点,研制了一种基于状态强迫耦合网络 (StateForce Coupled Network, SFCN) 的海浪智能预报模型。

该模型采用双分支结构,通过不同分支处理风场和浪场,通过网络高层语义实现风场和浪场的松弛耦合,避免了虚假风浪耦合,同时解决了传统卷积长短期记忆网络对风浪关系较弱区域预报能力不理想的问题。采用 HY-2B 卫星沿轨有效波高进行检验,结果发现,SFCN 计算效率大幅提升,预报结果与数值预报高度接近。

在这里插入图片描述

值得注意的是,基于这套模型建立的船载轻量化预报系统已经应用于 2023 年蛟龙号西北太平洋科学考察,以及中国第 13 次北极科学考察的随船预报保障中,实现了业务化推广应用。

目前,研究团队正在基于超分模型进行全球海浪智能预报系统的探索。 训练数据量和算力随着精度的增加呈指数级增长,但受显卡显存及训练时间的限制,直接训练全球高分辨率模型较为困难。因此,研究团队计划分两步进行:首先,利用 Swin Transformer 建立一个粗分辨率的全球模型,进行粗分辨率的特征挖掘;其次,建立一个超分模型,补充细节信息,实现高分辨率的全球海浪预报模型。预报检验结果如下图所示:

在这里插入图片描述

最后,李本霞重点介绍了团队研发的基于机器学习的海浪数值预报滚动订正技术。 该技术通过引入真值观测序列,使神经网络能够获取到已经发生的预报数值与真实海浪观测的差异信息,随着时间的推进,神经网络能够自适应地调整未来预报的数值,利用变化的观测序列完成海浪滚动预报订正,特别适用于现场有实时观测工程点(如海上风电场)的高精度海浪预报。

在这里插入图片描述

在这里插入图片描述

人工智能海洋学作为一个新兴的交叉学科,结合了海洋科学、人工智能、大气科学和计算机科学等领域的知识和技术,拥有广阔的发展前景。虽然目前作为数据驱动的 AI 模型还离不开传统数值模式,模型的训练和预测都需要基于数值模式以及数值模式结果的精度,但在未来,AI 预报和传统数值预报的有机结合将会是预报技术取得突破的有效途径。

关于李本霞

李本霞博士现任国家海洋环境预报中心海浪预报室主任,担任中文核心期刊《海洋预报》和《海洋科学前沿》编委,同时也是中国海洋大学兼职硕士导师,国家自然科学基金委员会评审专家,教育部学位论文评审专家,以及全国海洋灾害风险普查专家。

在这里插入图片描述

她的研究方向是海浪智能预报、海浪数值模拟及预警报技术、海洋灾害风险评估与区划、气候变化应对等方面的业务及研究工作。

值得关注的是,李本霞曾任公共安全科学技术学会预测预警专业工作委员会副主任委员,主持完成国家重点研发计划课题、海洋公益性行业科研专项、全球变化与海气相互作用专项等国家和省部级科研项目 10 余项。作为主要负责人完成国家重大工程「港珠澳大桥岛隧工程施工海洋环境预报保障」、「深中通道预报保障」、「南海可燃冰试开采海洋环境预报保障」等多个任务的预报保障工作。主编发布国家标准 3 个,行业标准 3 个,发明专利 3 项,译著 1 部,在国内外核心期刊上发表学术论文 20 余篇。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/448650.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode—1188. 设计有限阻塞队列【中等】(多线程)

2024每日刷题(183) Leetcode—1188. 设计有限阻塞队列 C实现代码 class BoundedBlockingQueue { public:BoundedBlockingQueue(int capacity) {sem_init(&enSem, 0, capacity);sem_init(&deSem, 0, 0);}~BoundedBlockingQueue() {sem_destroy(…

2024年10月15日读书笔记

前面已经提到了我们要使用自上而下的方法去构建金字塔结构 下面让我们用一个例子试试: 下面举例说明应用以上方法时思维的发展过程。 表3-1是美国某大型饮料公司财务部主管写的一份备忘录,我们将试着用以上方法改写该备忘录。 表3-1 答非所问的例子 收…

解读华为云Kuasar多沙箱容器技术,带来更强隔离性和安全性

摘要:沙箱技术的引入,为容器提供了更强的隔离性和安全性,成为云原生技术的重要组成部分。 本文来源 《华为云DTSE》第五期开源专刊,作者:华为云云原生开源团队研发工程师。 近年来,云原生容器技术飞速发展&…

软件供应链十年:探索开源的增长、风险和未来

回顾软件供应链状况报告的 10 年既是一个里程碑,也是一次行动号召。在过去十年中,开源消费改变了软件开发的世界。我们看到了前所未有的创新,但也出现了新的挑战,特别是在管理软件供应链的安全性和完整性方面。 在 Sonatype&…

【AcWing】算法基础课-数据结构

目录 1、单链表 2、双链表 3、栈 3.1 模拟栈 3.2 表达式求值 4、队列 5、单调栈 6、滑动窗口 7、KMP字符串 8、Trie字符串统计 方法一 方法二 9、并查集 9.1 合并集合 9.2 连通块中点的数量 10、堆 10.1 堆排序 10.2 模拟堆 11、哈希表 11.1 模拟散列表 拉…

内核提供的通用I2C设备驱动I2C-dev.c分析:file_ops篇

往期内容 I2C子系统专栏: I2C(IIC)协议讲解-CSDN博客SMBus 协议详解-CSDN博客I2C相关结构体讲解:i2c_adapter、i2c_algorithm、i2c_msg-CSDN博客内核提供的通用I2C设备驱动I2c-dev.c分析:注册篇 总线和设备树专栏: 总线…

从零开始实现大语言模型(十二):文本生成策略

1. 前言 大语言模型GPTModel通过多轮推理生成连续自然语言文本,每轮推理仅生成一个token。对输入文本做tokenization,将输入文本转换成包含num_tokens个token ID的列表,并输入大语言模型GPTModel,可以得到num_tokens个维度为voca…

第T4周:TensorFlow实现猴痘识别

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 目标: 实现猴痘病例图片的准确实别 具体实现: (一)环境: 语言环境:Python 3.10 编 译…

mysql innodb 引擎如何直接复制数据库文件?

mysql innodb 引擎如何直接复制数据库文件?介绍如下: 1、首先找到数据库文件所在位置 一般可以看my.conf/my.ini配置的文件的“datadir” 看示例: “MAMP”在Macos下的数据库文件位置: /Library/Application Support/appsolu…

DAY35||452.用最少数量的箭引爆气球 |435.无重叠区间 |763.划分字母区间

重叠区间专场。 452.用最少数量的箭引爆气球 题目:452. 用最少数量的箭引爆气球 - 力扣(LeetCode) 有一些球形气球贴在一堵用 XY 平面表示的墙面上。墙面上的气球记录在整数数组 points ,其中points[i] [xstart, xend] 表示水平直径在 xst…

恢复已删除文件的 10 种安卓数据恢复工具

由于我们现在在智能手机上存储了大量重要文件,因此了解数据恢复工具变得很重要。您永远不会知道什么时候需要使用 安卓 数据恢复工具。 由于不乏 Windows 数据恢复工具,因此从崩溃的计算机中恢复文件很容易。但是,当涉及到从 安卓恢复数据时…

论文笔记:Ontology-enhanced Prompt-tuning for Few-shot Learning

论文来源:WWW 2022 论文地址:https://arxiv.org/pdf/2201.11332.pdfhttps://arxiv.org/pdf/2201.11332.pdf 论文代码:暂未公开 笔记仅供参考,撰写不易,请勿恶意转载抄袭! Abstract 小样本学习旨在基于…

深入浅出:MySQL索引优化指南

一、引言 在数据库应用开发中,性能优化是一个永恒的话题。而索引作为提高数据库查询效率的关键手段,其设计和使用直接影响着系统的性能表现。本文将深入探讨MySQL索引的原理、类型以及优化策略,帮助读者更好地理解和应用索引,从而…

FreeRTOS:事件标志组

目录 一、简介 二、 事件控制块 三、相关API 四、 应用场景 一、简介 在FreeRTOS中,使用信号量可以实现同步,但是使用信号量来同步的话任务只能与单个的任务进行同步。有时候某个任务可能会需要与多个任务进行同步,此时信号量就无能为力。…

mysql 09 独立表空间结构

表空间中的页实在是太多了,为了更好的管理这些页面,设计 InnoDB 的大叔们提出了 区 (英文名: extent )的概念。对于16KB的页来说,连续的64个页就是一个 区 ,也就是说一个区默认占用1MB空间大小。…

QT--单选按钮(QRadioButton)和复选按钮(QCheckBox)

在Qt中,单选按钮(QRadioButton)和复选按钮(QCheckBox)是两种常用的用户界面控件,它们的主要区别在于选择行为和用途: QRadioButton(单选按钮) 选择行为:单选…

jvm虚拟机调优实战

使用命令 jps查看进程使用jstat gc -1 5000查看内存占用和回收情况 正式测试 是否跑job区别。大量的job,部分用户点击的热数据 ,不同时刻在跑 600-700对比 200 多了400-500m,代码原数据(不占用堆区)占了300m,所以 堆空间老年代(90…

VsCode环境配置C++环境

目录 第一步下载应用 第二步应用文字汉化 第三步安装编译器MinGW 第四步 环境变量的配置 第五步 打开VsCode 第六步 配置环境设施 几个其他的好用的插件 会了吧 MarsCode: AI Coding Assistant 第一步下载应用 VSCode下载官方指定网址: Visual Studio Cod…

使用豆包MarsCode 来处理 Excel 的数据吧!

作者可乐三分糖 背景 Excel 是大部分没有信息化的公司通用的数据处理手段。但并不是所有的人对 excel 都是非常熟悉的。这些同学主要会遇到三类问题: Excel 的一些操作问题,如公式怎么写跨表处理太复杂,即使是写公式也很繁琐。一些数据批处…

关于k8s集群高可用性的探究

1. k8s的高可用的核心是什么? 说到核心、本质 意味着要从物理层来考虑技术 k8s是一个容器编排管理工具,k8s受欢迎的时机 是docker容器受欢迎时,因为太多的docker容器,管理起来是一个大工程 那么刚好k8s是google自己用了十来年…