ChatGPT热潮下水力模型的思考

    

    ChatGPT横空出世,快速火爆全球,基于大数据、大算力的人工智能技术来势汹汹、势不可挡,似乎要革全世界打工人的命!

    本人多年来一直从事供排水系统水力建模和应用相关的工作,在水行业里,算是跟数据和模型打交道比较多了。面对大数据时代的到来,我也常在思考,数据能给水行业带来怎样的变化?也常有朋友问我关于数据模型和机理模型的问题,例如:

● 二者的本质区别是什么?

● 既然水力模型的建立和维护如此困难,未来是不是数据模型直接取代机理模型?

● 假如数据模型和机理模型可以结合起来应用,结合的逻辑是什么?

    对于上述问题,虽然自己也有一些零零碎碎的思考,但同时也有不少疑惑。最近观看了美国国家工程院院士、东方理工高等研究院常务副院长张东晓教授的线上主题演讲《科学机器学习中的知识嵌入与知识发现》,有点醍醐灌顶的感觉,特以此文与大家分享。

#点击获取演讲链接#icon-default.png?t=N3I4https://www.bilibili.com/video/BV1254y1w7Kh/?spm_id_from=333.337.search-card.all.click&vd_source=b8f422275696efa2614c3b0539869466

    

张教授的演讲包括三部分,分别是:

● 数据模型:数据驱动模型及其局限性;

● 知识嵌入:即理论指导的数据驱动模型,也就是构建具有物理常识的AI模型;

● 知识发现:即数据驱动的模型挖掘,是利用AI探索物理原理和机理等新知识。

张教授指出,机理模型属于人类探索世界,已经获取的知识的一部分。通过引入行业知识,可以有效提升机器学习模型的效果;将知识的嵌入和知识的发现结合起来,形成闭环,可以极大提高AI解决实际问题的能力。 

01/数据驱动模型:有效但有局限性

    张教授先举了光伏发电预测的例子,来说明数据驱动的有效性。通过输入辐照量、温度、湿度、风速、昼夜等特征变量,以及历史的光伏发电量数据,利用卷积神经网络或者循环神经网络等方法建立数据的映射关系,基于此映射关系和天气预报数据,预测第二天光伏的发电量。核心逻辑就是寻找多元输入变量和目标变量之间的复杂映射关系,从而构建它预测的模型。

    在供水行业,大量的研究也是采用类似的方法进行需水量预测,相关的文章不计其数,但实际用于供水生产实践的寥寥。

    张教授继而分析了数据驱动模型的局限性,主要有:

● 数据不易获取且采集成本高昂;如地下水资源勘查所需一口测量井的成本高达几千万元;深度学习和参数训练需要大数据、大模型和大算力,如ChatGPT-3有1750亿个参数,费用不菲。

● 数据驱动模型常用的MSE(均方误差)等指标,是对误差的数据平均度量,无法区分物理系统过程的差异。

● 没有常识、缺少知识;由于缺乏人类世界的各种常识和知识,结果可能错的离谱!

02/知识嵌入:克服数据模型局限性的解决方案

    张教授提出构建数据和知识(机理)双驱动模型的理念,提升模型精度和鲁棒性,降低数据的需求。

   

     知识嵌入,是将行业的已有经验和知识整合到数据模型中的过程,即是构建具有物理常识的数据模型。与前述的数据驱动模型相比:

● 提高准确性:借助机器学习的强拟合能力,描述变量间高维复杂映射关系;

● 提高可靠性:利用行业先验知识,保证预测结果符合原有的物理机理。

    张教授用能源领域的案例,展示了在数学建模过程中的不同环节进行知识嵌入的方法,如数据预处理环节、模型结构设计环节、模型调优环节等。并且以地下水流动模型为例,说明行业经验和机理如控制方程、边界条件等,对于提高模型预测能力的重要性。在此框架下,可构建替代模型或数字孪生,从而减少数据模型对于数据量的依赖,缩短训练时间,提高模型的准确性。

    与地下水流动模拟预测相似,城市内涝的实时预测,常受限于机理模型计算的速度太慢,城市级别的内涝模拟动辄几个小时,无法满足即时响应的需求。数据模型由于缺乏足够的历史数据,预测结果误差太大,不足以让人信服。把机理模型和数据模型结合,能大大提高计算的速度和预测的精度,将会是一个很好的技术路线。

    下面分享一个我们公司基于实时在线水力模型做的爆管警告的例子,就是利用机理模型嵌入到数据模型中,实现即时可靠的爆管警告。

    常规供水调度的爆管判断,是基于多个相关监测点的压力突降,且用水量上升,则判断为存在大漏或者爆管。这个方法的难点在于:如何确定监测点之间的关联,特别是压力监测点和流量监测点的关系。常规方法是通过测点之间距离形成监测组的概念,这种方法的缺点:人工工作量大,可靠度低,经常误判,导致实用性下降。

    基于实时在线水力模型,能实时计算各个监测点之间的相关关系,把相关度高的监测点自动形成事件监测组,再利用模拟值和监测值的误差突变,从而提高事件报警的准确性和可靠度。

03/知识发现:数据+机理,行业+AI的深度融合

    最有意思的是张教授最后谈到基于数据模型的知识发现。什么叫知识发现?可以理解为从时空观测数据中直接挖掘控制方程,从而为世界获取新的知识。

    以万有引力举例,第谷花了近40 年的时间获取火星轨道的观测数据,开普勒又花了17年的时间,运用这些数据来研究行星运动的轨迹,最后得到行星运行的三大定律。在此基础上,天才的牛顿进行了理论的延伸和公式的推导,发现了万有引力定律,距离开普勒的发现已经是69年之后,从第谷到牛顿前后花了一百多年的时间。但有了AI的加持,未来计算机技术的发展,将大大加快这一过程!

    关于是AI加行业,还是行业加AI的争论,张教授认为,AI是算法,属于通用的模型,解决各个行业的问题应该是行业加AI,其实就是机理模型加AI才是未来的发展之路。知识的嵌入和知识的发现,形成一个闭环,从而大大提高人工智能解决实际问题的能力。

    最后重新回到文章开始的三个疑问。从本质来说,不管是数据模型还是机理模型,都是人类认识和理解世界的方法,在当前的技术手段,机理模型和数据模型都有其有效性和局限性,寻找他们的结合点将会产生很大的价值。作为一个理工男,基本的观点是:世界是可解释的。相信AI将不仅是系统结果的产生者,而是最终变成知识的发现者。在人工智能的浪潮中,未来人类(机器)发现知识的速度会远远超过曾经的“天才”们,细思极恐

     最后还是强烈建议大家去看张教授的视频。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/42609.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python基础词汇解析

Python基础词汇解析 作为一门流行且易学的编程语言,Python在很多场合得到了广泛的应用。在学习Python编程的过程中,掌握各类基础词汇是非常关键的。本文将介绍Python编程中一些常见且重要的基础词汇,帮助大家更好地了解和掌握Python编程。 …

全网最全的AI绘画提示词网站,看这一篇就够了!

要说2023年什么最火,绝对是以ChatGPT为代表的AI工具了,特别是AI绘画,而用好AI的关键,就是要学会使用关键词,也叫提示词,提示词是AI绘画的核心,本次就给大家分享几个AI绘画关键词网站&#xff0c…

ChatGPT+markmap,1分钟帮我写完了一份测试用例

近段时间,我相信没有人不知道AI吧,今天,我尝试了下,用ChatGPT来写测试用例,而且顺带在markmap生成了脑图,整个过程非常丝滑,下面分享给大家,希望对大家有所启发。 1、使用ChatGPT提问…

【ChatGPT|AI 应用】如何用 ChatGPT 快速制作思维导图

应用背景 ChatGPT 应用越来越广,前面的文章有介绍【如何用 ChatPDF 秒读论文】,它能帮助我们更快的提炼 PDF 文献的重点,帮助我们快速阅读!接下来,我们将进一步使用 ChatGPT 生成思维导图,建立记忆链接。本…

OpenAI发布AGI路线图,AGI或成为人类的巨大力量增幅器!网友:适应or死亡

编|桃子 昕朋源|新智元 ChatGPT爆火出圈让人们开始重新思考人工智能的未来在哪?恰在昨日,OpenAI发布了通用人工智能路线图,分享了其对AGI的短期和长期规划。 继ChatGPT成当红炸子鸡后,微软、谷歌、Meta等大…

“释放你内心的艺术家:用我们的革命性API接口探索绘画世界“(免费API绘画接口)

接口调用介绍 文章目录 接口调用介绍前言一、在线文档地址二、使用步骤1.请求方式2.注意事项3.header4.请求参数5.请求示例6.返回结果:7.返回示例8.效果图集合 总结 前言 绘画是一种充满创造力和想象力的艺术形式,许多人喜欢通过绘画来表达自己的情感和…

推荐一款 IntelliJ IDEA 神级插件,由 ChatGPT 团队开发,堪称辅助神器!

点击关注 👉 JAVA日知录 2023-04-28 08:32 发表于安徽 收录于合集#开发工具14个 什么是Bito? Bito是一款在IntelliJ IDEA编辑器中的插件,Bito插件是由ChatGPT团队开发的,它是ChatGPT团队为了提高开发效率而开发的一款工具。Bit…

文心一言是中文版的ChatGPT?多角度分析猜测文心一言到底是什么?

文心一言是中文版的ChatGPT?多角度分析/猜测文心一言到底是什么! ChatGPT爆火网络,一时间风靡不断。 AI替代人类工作的传言四起 宣布ChatGPT类似产品的公司股价大涨,这到底是什么? 国产的类似产品到底到了什么程度…

chatgpt赋能python:Python中数字相乘的简介和应用

Python中数字相乘的简介和应用 什么是Python数字相乘 在Python编程语言中,数字相乘是一个很常见的计算操作,它用于将两个数字相乘,结果是乘积。Python的数字类型可以是整数、浮点数或复数。Python支持三种基本算术运算符:加号&a…

李永乐团队2021数学基础过关660题勘误表

李永乐团队2021数学基础过关660题勘误表 附:各大高校专业课资料整理可以看一下我的博客主页上传的资源哦!感谢关注,评论♥点个赞再白嫖呗☞2333

【考研数学】张宇1000题,汤家凤1800,李永乐660,应该怎么选择?

这三本练习册,想必没有人不知道。 什么?你不知道?你肯定每天做的是假题,考的是假研究生! 每年都有许多同学在选择复习资料的问题上停滞不前,为了选一本最好的,比来比去,一个礼拜过去…

Review of Algorithm (HITSZ) 含22年真题回忆

Review of Algorithm (HITSZ)含22年真题回忆 1. Time Analysis1.1 Basic1.2 Master Method1.3 Recurrence Problems 2. Sorting Algorithm2.1 Comparing Sort2.1.1 Insertion Sort2.1.2 Merge Sort 2.1.3 Shell Sort2.1.4 Lower boundary of comparison …

李永乐老师讲博弈论:帝王为啥要杀掉有功之臣

帝王为啥要杀掉有功之臣?李永乐老师给大家讲讲博弈论基础。 博弈论最早由数学家冯诺依曼开拓,后来经过约翰纳什发展,是数学的一个分支。博弈论所研究的是:在一定的规则之下,参与博弈的几个人通过一定的规则使自己的利…

李永乐讲卷积神经网络,卷积神经网络最新进展

BP神经网络的核心问题是什么?其优缺点有哪些? 。 人工神经网络,是一种旨在模仿人脑结构及其功能的信息处理系统,就是使用人工神经网络方法实现模式识别.可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题,神经网络方法允许样品有较大的缺损和畸变.神经网络的…

傅里叶变换与反变换(李永乐老师笔记)

一) 傅里叶分解 任何一个时域空间的周期性函数都可以分解成一组正(余)弦波, (图一) 二) 傅里叶变换 时域函数 -> 频域函数 f(t) 经过F操作分解成一组正余弦波(F操作为傅里叶变换) (图二) 怎么在频域空间描述这组正余弦波呢,直觉的答案是用不同频率和相应的振幅来描述…

【笔记】ChatGPT是怎样炼成的(李宏毅2023机器学习课程引入部分)

来源:【授权】李宏毅2023春机器学习课程 ChatGPT太火热了,借此简单了解一下 ChatGPT的newbie之处在哪里? 同一个问题,它的每次回答都不同;处于同一个chat中,我可以追问多个问题,因为它知道上下…

登录、退出(关于token)

关于token https://www.jianshu.com/p/8d28e60af440 一般APP都是刚安装后,第一次启动时需要登录(提示你需要登录或者直接启动在登录界面)。而只要登录成功后,以后每次启动时都是登录状态,不需要每次启动时再次登录。…

ChatGPT商业版免授权源码/AI绘画系统/用户付费系统

🎉 有需要的朋友记得关赞评,文章底部来交流!!! 🎉 ✨ 源码介绍 最新 ChatGPT商业版源码,该产品支持用户付费套餐,AI 绘画,支付对接,卡密购买兑换等功能&#…

Latex投稿Elsevier后被要求修改格式(三)图、表和算法汇总

目录 1. 图 2. 表 3. 算法 想要在Latex中加入相关图、表和算法只要将对应的代码段放在正确的位置即可,这个“正确”就是文中提到图、表和算法的段落下方啦~~ 附上Latex文章代码(这里面还没有图、表和算法) Latex投稿Elsevier后被要求修改…

Latex投稿Elsevier后被要求修改格式(四)如何修文章References的颜色

论文到了修改阶段,不可避免就要标记对应的修改部分,之前修改设计的都是正文部分的内容,修改颜色的代码相对简单, 如下所示: \textcolor{blue}{正文修改后需要标记的句子} 这样的代码无法跨行标记,想要实现…