最容易被ChatGPT抢饭碗的科学家,竟然真的是数学家???

05faed24a5add4d1f8e2d561ec149860.png

589d9977e97632fadfba9dc7cc2b3d6b.png

可用于 ChatGPT 的 11 个插件。图片来源:OpenAI

撰文 杜若云

编辑 吴兰、魏潇

北京时间 3 月 23 日,OpenAI 发布了第一批可接入 ChatGPT 的插件。这些插件由 11 个第三方提供,同时 OpenAI 官方也提供了两个官方插件 Browsing 和 Code Interpreter。

根据 OpenAI 官网的介绍[2],第三方的插件可以用来查询航班,订机票(Expedia,KAYAK),对比商品价格,购物(Klarna Shopping,Shop,Instacart),检索实时消息(FliscalNote),进行数学计算(Wolfram),学习语言(Speak)等等。在这些插件的加持下,ChatGPT 终于可以走出 2021 年之前的世界,与当下“联网”了。

Wolfram 加持,数学能力显著提高

第三方插件的接入使得 ChatGPT 更加强大。作为大型语言模型(LLM)神经网络,ChatGPT 强大的生成文本材料能力有目共睹,但它并不能去做复杂的计算推理工作,也无法系统地产生正确的(而不是“看上去正确”的)数据。但在接入计算功能强大的 Wolfram 插件后,ChatGPT 不仅可以做这些事情,在计算层面上“胡言乱语”的习惯也可以被改正

通过下面这道大学数学题,就能看出接入插件前后 ChatGPT 的不同表现。图 1 中的 Genie 来自代码编辑器 VScode,它是该软件的 ChatGPT 扩展,能够代表没有接入插件前的 ChatGPT。

29049bc34dd3c99948759684a3a8d620.png

图 1 没有接入计算插件 Wolfram 前,ChatGPT 的“胡言乱语”。来源:作者

4bc35148d02f7c35e751b5fa61c68801.png

图 2 接入插件的 ChatGPT 给出了正确的答案。来源:[1]

通过简单的检查我们发现,在没有接入 Wolfram 插件时,ChatGPT 给出了一个“看起来过程很完美”但是结果完全错误的回答,但是在接入 Wolfram 插件后的回答是完全正确的。那么,这个插件是如何避免 ChatGPT “胡说”的?解决方法听起来很简单:ChatGPT 会通过插件将问题发送给 WolfrmAlpha 进行计算,然后根据返回的结果来“决定”回答什么。同时用户可以点击“Used Wolfram”按钮来检查 ChatGPT 是否“编造”回答。这意味着,通过 Wolfrm 插件我们可以判断出哪些信息(计算相关)是正确的,哪些是“编造”的。

对于与现实世界有关的问题,ChatGPT 也可以靠这种方法给自己打上“补丁”。比如向无插件版 ChatGPT 提问土耳其的畜牧数量有多少时,它“郑重其事”地引用了土耳其统计局(Turkish Statistical Institute),并“编造”了一个看似合理的数据(图 3)。当使用接入Wolfram 插件的 ChatGPT 时(图 4),这个回答和 WolframAlpha(Wolfram 公司的一款软件,也是 Wolfram 插件背后的“回答者”)中给出的答案完全相同,这也从侧面验证了该插件的工作原理。

b027f67674fbee79b27c254c2c677c58.png

图 3 无插件的 ChatGPT 对土耳其畜牧业问题的编造回答。

8d5c7618633e7cad3a35e8876a5a8b2b.png

图 4 有插件后 ChatGPT 能够给出正确答案。来源:[1]

目前,Wolfram 和 ChatGPT 的联动,仅限于 ChatGPT 将用户用自然语言询问的问题通过插件发送给 WolframAlpha。由于 WolfrmAlpha 的构建初衷就是处理各种“混乱”的类人自然语言并给出答案,因此它可以处理来自 ChatGPT 的用户询问,并通过插件返回答案[1],因此目前的 Wolfram 插件对于 ChatGPT 是一个简单版本,未来也许可以通过训练使 ChatGPT “搞懂”更复杂更强大的 Wolfram 语言,这对于 ChatGPT 的计算能力提高更为关键,对科研职业的作用也更为明显

数学家危险了?

那么这是否意味着,插件的接入会使 ChatGPT 的功能足够强大到影响以至于取代某些职业呢?

根据 OpenAI 最近发表在预印本网站 arXiv.org 上的研究论文[3],我们可以看到不同职业对于 GPT 的“暴露”程度。这里的“暴露”是指将完成任务的时间减少至少一半,即当“暴露”程度达到 100%,GPT 能至少帮你将完成任务的时间减少一半。不同职业的“暴露”程度有所不同,最令人惊讶的是,数学家的暴露程度超越了很多看似技术含量不太高的工作,达到了 100%。作为对比,财务经理和平面设计师的暴露程度为 13%,公关专家和创意作家的暴露程度分别为 67% 和 69%,而经常“被失业”的翻译和口译的暴露程度,也只有 77%。

35e01b8606bdd4da04a909647e57dc48.png

图 5 OpenAI 关于 AI 对不同职业影响程度的研究结果 来源:[3]

从论文发表的时间来看,这些数据是 GPT-4 发布后和 ChatGPT 插件发布前的数据,但从插件的作用和机制来看,插件的引入或许导致这些职业的“暴露”程度更高,同时会减少用户检查 ChatGPT 是否在“胡说八道”的时间但这并不意味数学家将被取代,他们可以将大量繁琐的计算和代码工作交给 ChatGPT 来完成。这将大大提高科学家的工作效率,让他们有时间思考并进行原创性工作。如果 ChatGPT 可以帮助数学家和理论物理学家完成繁琐的计算,并得到大量结果,这也会对我们理解新科学大有帮助。

a35214be188031b7fe3e4090101c9822.png

图 6 陶哲轩分享的 ChatGPT 使用心得 来源:[7]

著名数学家陶哲轩便经常在自己的博客[7]中分享自己如何在科研和教学中使用 ChatGPT。图 6 是他最近探索的几个小用法:他让 ChatGPT “阅读”已有的 arXiv 搜索 API 文档 ,并要求 ChatGPT 构建一个新的 arXiv 搜索查询,能够根据给定关键词和文章投递时间搜索论文如果将得到的结果复制粘贴到浏览器中,还可以得到一个 RSS 订阅,其中含有 10 篇包含关键词"Collatz"和投递时间处于 2011 年到 2016 年的文章(图 7)。在这个过程中,ChatGPT 扮演着阅读 API 文档,并生成符合条件的搜索查询的角色。科研人员无需再搞懂如何操作 API,只要将自己的需求直接告诉 ChatGPT 即可获得想要的论文。(这是一个简单的示例,如何发掘出 ChatGPT 的潜力还需要各位读者发挥想象力。)

36624726599a38fb10e63a0c3643d6c1.png

图 7 利用 ChatGPT 生成的 arXiv 论文检索结果的 RSS。来源:作者

除此之外,陶哲轩还会用 ChatGPT 帮自己备课,比如询问它在线性代数课堂中聪明的学生可能会提出的问题,来启发自己课程讲授以及布置作业的方向。在博客中他提到:“虽然这些 AI 工具无法直接帮助我完成核心任务——如尝试解决一个尚没有答案的数学问题,但是它们对于各种次要(但仍与工作相关)任务时非常有效(尽管之后需要一些手动调整)。”

隐私隐患如何解决

目前来看,这些职业是否会被 AI 取代,取决于后者的未来发展,但这毫无疑问会深刻改变我们的生活生产方式。OpenAI 公共政策主管 Anna Makanju 表示:“这项技术将深刻改变我们的生活方式。我们现在仍有时间来指导其发展轨迹、限制滥用并确保最广泛有益的结果。”[6]

除了职业安全问题,我们还需要关心一下自己的隐私。担心“聪明”的 ChatGPT “窃取”用户隐私是一个 AI 诞生起就如形随形的问题,而第三方插件的引入使得这个问题更加复杂——我们难以保证这些插件不会利用 ChatGPT 获得用户隐私来牟利。3 月 20 日,ChatGPT 出了一个几乎引发全网骚动的 bug,一些用户可以在自己的聊天页面里看到他人的聊天记录。OpenAI 不得不将 ChatGPT 强制下线修复[4],这令大批打工人叫苦不迭。更糟糕的是,ChatGPT 下线的几个小时里,一部分活跃用户的姓名、电子邮件地址、支付地址、信用卡号的最后四位和信用卡到期时间也被泄露,尽管 OpenAI 官方认为泄漏的数据量很少,但如何采取措施确保用户隐私安全将成为所有 AI 公司的首要任务。

如上所述,ChatGPT 这样的 AI 在未来肯定会深刻地影响目前社会的生产生活格局,改变人们的工作生活方式,因此如何确保新的“人+AI”模式顺利进行并对人类社会产生有益影响,对于政策制定者和 AI 公司有着极大的考验。

主要参考资料:

[1]https://writings.stephenwolfram.com/2023/03/chatgpt-gets-its-wolfram-superpowers/

[2]https://openai.com/blog/chatgpt-plugins

[3]https://arxiv.org/pdf/2303.10130.pdf

[4]https://twitter.com/OpenAI/status/1639297361729191936

[5]https://openai.com/blog/march-20-chatgpt-outage

[6]https://openai.com/safety

[7]https://mathstodon.xyz/@tao

本文来自微信公众号“科研圈”。如需转载,请在“科研圈”后台回复“转载”,或通过公众号菜单与我们取得联系。相关内容禁止用于营销宣传。封面图来源:Pixabay。

▽ 精彩回顾 ▽

294929ecde6eb067bb82490651adf373.png

bafdd216d72910b864ba92040257344b.png

点个“在看”,及时获取最新学术资讯

6cac82cddad4b4ffe9eb5dcc57ab09f1.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15011.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

80%白领危了!OpenAI发布GPT时代就业秘笈:34大铁饭碗保命

【导读】GPT-4发布没几天,OpenAI直接告诉所有人,GPTs是通用技术,80%的美国人的工作受到影响。想要保命,且看这34大「铁饭碗」。 前脚刚推出GPT-4,OpenAI后脚就发布了35页论文官宣: 80%的美国人&#xff0c…

字节正在内部测试对话类 AI 项目;Deepmind 推出新系统革新排序算法;ChatGPT iOS 应用更新|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

自学了Python半年后,发现,这3本书能让你少走一半弯路!

Time will tell. 我是在疫情期间去开始接触Python的,唯一的一点代码基础就是在校时学的那一点皮毛。但在我这半年多的自学时间里,我发现它越来越有意思,Python是非常友好并且易于学习的! 它几乎可以做任何事,从简单的脚本创建、web 、到数据可视化以及 AI 人工智能,越来…

2022,AIGC元年?

文|世昕 编|石灿 2022年12月16日,Science杂志发布了2022年度科学十大突破,韦伯望远镜当选为年度最大科学突破,可谓实至名归。而在其他入选的科学突破中,AIGC也赫然在列。 这或许是当下最炙手可热的概念了。…

专业、简单、稳定,融云重新定义互联网通信云服务

艾瑞咨询《2023 年全球互联网通信云行业研究报告》(下简称《报告》)显示,79.1% 的开发者计划或已经出海,其中已将应用推到海外的开发者占比 43%。关注【融云全球互联网通信云】了解更多 后台回复【报告】获取完整版 消费群体成长…

PaddlePaddle中试用国人开源语言大模型RWKV Raven/Novel

★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>> (开启本项目前,如果想尝试7B模型,请开启32GB以上的GPU环境) (本项目由我编写的rwkv-paddle提供推理代码支持&#xff0…

蓝桥杯赛前自救攻略,备赛抱佛脚指南

目录 前言一、复习语言知识1、代码起手框架2、vector初始化2、unordered_map3、输入输出问题 二、复习考试范围知识1、深度优先搜索(Depth-First-Search)模板2、随机字符、数字 三、复习比赛真题1、模拟题2、动态规划题 四、其他 前言 明天就要开始蓝桥杯…

AI 快被玩坏了!还不进来看看它能干些啥?

自从ChatGPT 掀起浪潮,不少人都在担心 AI 快要抢人类饭碗了。 就连央视财经也为此专门发过一个报道: 不得不承认,现在 ChatGPT 等 AIGC 工具已势不可挡——浪潮既来,不进则退。 有程序员这样说——这用过 Copilot 就会觉得&#x…

ChatGPT:与AI佛祖对话,探寻心灵的平静与自由!

现代人的生活充满了繁忙和压力,随之而来的是内心的焦虑和不安。为了追求真正的幸福和意义,越来越多的人开始寻求内心的平静和自由。而佛教的智慧和修行方法成为了许多人追寻心灵成长的重要途径。 然而,对于很多人来说,佛教的教义和…

使用 ChatGPT ,通过自然语言编写 eBPF 程序和追踪 Linux 系统

eBPF 是一项革命性的技术,起源于 Linux 内核,可以在操作系统的内核中运行沙盒程序。它被用来安全和有效地扩展内核的功能,而不需要改变内核的源代码或加载内核模块。今天,eBPF被广泛用于各类场景:在现代数据中心和云原…

ChatGPT三个关键技术

情景学习(In-context learning) 对于一些LLM没有见过的新任务,只需要设计一些任务的语言描述,并给出几个任务实例,作为模型的输入,即可让模型从给定的情景中学习新任务并给出满意的回答结果。这种训练方式能…

论文分享-- From RankNet to LambdaRank to LambdaMART: An Overview

博客内容将首发在微信公众号"跟我一起读论文啦啦",上面会定期分享机器学习、深度学习、数据挖掘、自然语言处理等高质量论文,欢迎关注! 严格来说,这并不是一篇论文,只是一个 r e p o r t report report &a…

ChatGPT的一小步,NLP范式转变的一大步

作者:符尧,yao.fued.ac.uk,爱丁堡大学 (University of Edinburgh) 博士生,本科毕业于北京大学;与Tushar Khot,彭昊在艾伦人工智能研究院 (Allen Institute for AI) 共同完成英文原稿;与李如寐&a…

4月最新编程排行出炉,第一名ChatGPT都在用~

作为一名合格的(准)程序员,必做的一件事是关注编程语言的热度,编程榜代表了编程语言的市场占比变化,它的变化更预示着未来的科技风向和机会! 快跟着一起看看本月排行有何看点: 4月Tiobe排行榜前…

虚幻4蓝图通信

本案例的功能为让玩家控制小白人,并按E让选中的物体旋转 立方体蓝图 小白人蓝图 选人设置 运行结果

虚幻引擎之相机控制

通过本节学习,我们可以在虚幻引擎中按照特定时间来切换摄像机视角,我们可以很方便的进行观看不同摄像机的视野。 首先打开虚幻,在这里我是用的是虚幻4.19,打开虚幻之后,我们首先新建一个工程,在这里我们不使…

虚幻引擎5亮点整理,5大核心一目了然

由EPIC研发的UE5,于2022年4月正式发布。作为全新的实时工作平台,UE5有以下亮点值得关注! Nanite 可以制作海量细节的地图,通过nanite不需要手动贴图,也不需要手动创建LOD Lumen光照系统 为了获得最佳的光照效果&#x…

虚幻引擎C++开发学习(一)

文章内容来自于Udemy课程。第一章为设置C和虚幻环境,直接略过。 第二章内容为一个小游戏,名字叫Triple X,是个简单的数字益智游戏。它基于三个未知数字。你将侵入某种计算机锁。游戏的想法是找到一个有效的三个数字组合。 比如关卡1&#x…

虚幻引擎的控制台命令(长期更新)

小标题前如果标注具体虚幻的版本号,则仅在特定版本中有效 若没标注,则代表全版本通用 局内 【UE5】世界分区(World Partition) 显示世界分区加载网格 2D&3D wp.Runtime.ToggleDrawRuntimeHash3D 3D显示世界分区的加载网格 …

下载虚幻引擎提示错误代码MD-DL

先放结论:因为已经下载过UE4版本的引擎,再下载其它版本引擎的时候默认会放到UE4版本的引擎的同级目录下,改下路径就行了。 把UE4改成UE5就好了,把他俩分开。UE4是我自己之前分给4.26版本的文件夹。 我在下载时遇到了这个问题&am…