最容易被ChatGPT抢饭碗的科学家，竟然真的是数学家？？？

可用于 ChatGPT 的 11 个插件。图片来源：OpenAI

撰文杜若云

编辑吴兰、魏潇

北京时间 3 月 23 日，OpenAI 发布了第一批可接入 ChatGPT 的插件。这些插件由 11 个第三方提供，同时 OpenAI 官方也提供了两个官方插件 Browsing 和 Code Interpreter。

根据 OpenAI 官网的介绍[2]，第三方的插件可以用来查询航班，订机票（Expedia，KAYAK），对比商品价格，购物（Klarna Shopping，Shop，Instacart），检索实时消息（FliscalNote），进行数学计算（Wolfram），学习语言（Speak）等等。在这些插件的加持下，ChatGPT 终于可以走出 2021 年之前的世界，与当下“联网”了。

Wolfram 加持，数学能力显著提高

第三方插件的接入使得 ChatGPT 更加强大。作为大型语言模型（LLM）神经网络，ChatGPT 强大的生成文本材料能力有目共睹，但它并不能去做复杂的计算推理工作，也无法系统地产生正确的（而不是“看上去正确”的）数据。但在接入计算功能强大的 Wolfram 插件后，ChatGPT 不仅可以做这些事情，在计算层面上“胡言乱语”的习惯也可以被改正。

通过下面这道大学数学题，就能看出接入插件前后 ChatGPT 的不同表现。图 1 中的 Genie 来自代码编辑器 VScode，它是该软件的 ChatGPT 扩展，能够代表没有接入插件前的 ChatGPT。

图 1 没有接入计算插件 Wolfram 前，ChatGPT 的“胡言乱语”。来源：作者

图 2 接入插件的 ChatGPT 给出了正确的答案。来源：[1]

通过简单的检查我们发现，在没有接入 Wolfram 插件时，ChatGPT 给出了一个“看起来过程很完美”但是结果完全错误的回答，但是在接入 Wolfram 插件后的回答是完全正确的。那么，这个插件是如何避免 ChatGPT “胡说”的？解决方法听起来很简单：ChatGPT 会通过插件将问题发送给 WolfrmAlpha 进行计算，然后根据返回的结果来“决定”回答什么。同时用户可以点击“Used Wolfram”按钮来检查 ChatGPT 是否“编造”回答。这意味着，通过 Wolfrm 插件我们可以判断出哪些信息（计算相关）是正确的，哪些是“编造”的。

对于与现实世界有关的问题，ChatGPT 也可以靠这种方法给自己打上“补丁”。比如向无插件版 ChatGPT 提问土耳其的畜牧数量有多少时，它“郑重其事”地引用了土耳其统计局（Turkish Statistical Institute），并“编造”了一个看似合理的数据（图 3）。当使用接入Wolfram 插件的 ChatGPT 时（图 4），这个回答和 WolframAlpha（Wolfram 公司的一款软件，也是 Wolfram 插件背后的“回答者”）中给出的答案完全相同，这也从侧面验证了该插件的工作原理。

图 3 无插件的 ChatGPT 对土耳其畜牧业问题的编造回答。

图 4 有插件后 ChatGPT 能够给出正确答案。来源：[1]

目前，Wolfram 和 ChatGPT 的联动，仅限于 ChatGPT 将用户用自然语言询问的问题通过插件发送给 WolframAlpha。由于 WolfrmAlpha 的构建初衷就是处理各种“混乱”的类人自然语言并给出答案，因此它可以处理来自 ChatGPT 的用户询问，并通过插件返回答案[1]，因此目前的 Wolfram 插件对于 ChatGPT 是一个简单版本，未来也许可以通过训练使 ChatGPT “搞懂”更复杂更强大的 Wolfram 语言，这对于 ChatGPT 的计算能力提高更为关键，对科研职业的作用也更为明显。

数学家危险了？

那么这是否意味着，插件的接入会使 ChatGPT 的功能足够强大到影响以至于取代某些职业呢？

根据 OpenAI 最近发表在预印本网站 arXiv.org 上的研究论文[3]，我们可以看到不同职业对于 GPT 的“暴露”程度。这里的“暴露”是指将完成任务的时间减少至少一半，即当“暴露”程度达到 100%，GPT 能至少帮你将完成任务的时间减少一半。不同职业的“暴露”程度有所不同，最令人惊讶的是，数学家的暴露程度超越了很多看似技术含量不太高的工作，达到了 100%。作为对比，财务经理和平面设计师的暴露程度为 13%，公关专家和创意作家的暴露程度分别为 67% 和 69%，而经常“被失业”的翻译和口译的暴露程度，也只有 77%。

图 5 OpenAI 关于 AI 对不同职业影响程度的研究结果来源：[3]

从论文发表的时间来看，这些数据是 GPT-4 发布后和 ChatGPT 插件发布前的数据，但从插件的作用和机制来看，插件的引入或许导致这些职业的“暴露”程度更高，同时会减少用户检查 ChatGPT 是否在“胡说八道”的时间。但这并不意味数学家将被取代，他们可以将大量繁琐的计算和代码工作交给 ChatGPT 来完成。这将大大提高科学家的工作效率，让他们有时间思考并进行原创性工作。如果 ChatGPT 可以帮助数学家和理论物理学家完成繁琐的计算，并得到大量结果，这也会对我们理解新科学大有帮助。

图 6 陶哲轩分享的 ChatGPT 使用心得来源：[7]

著名数学家陶哲轩便经常在自己的博客[7]中分享自己如何在科研和教学中使用 ChatGPT。图 6 是他最近探索的几个小用法：他让 ChatGPT “阅读”已有的 arXiv 搜索 API 文档，并要求 ChatGPT 构建一个新的 arXiv 搜索查询，能够根据给定关键词和文章投递时间搜索论文。如果将得到的结果复制粘贴到浏览器中，还可以得到一个 RSS 订阅，其中含有 10 篇包含关键词"Collatz"和投递时间处于 2011 年到 2016 年的文章（图 7）。在这个过程中，ChatGPT 扮演着阅读 API 文档，并生成符合条件的搜索查询的角色。科研人员无需再搞懂如何操作 API，只要将自己的需求直接告诉 ChatGPT 即可获得想要的论文。（这是一个简单的示例，如何发掘出 ChatGPT 的潜力还需要各位读者发挥想象力。）

图 7 利用 ChatGPT 生成的 arXiv 论文检索结果的 RSS。来源：作者

除此之外，陶哲轩还会用 ChatGPT 帮自己备课，比如询问它在线性代数课堂中聪明的学生可能会提出的问题，来启发自己课程讲授以及布置作业的方向。在博客中他提到：“虽然这些 AI 工具无法直接帮助我完成核心任务——如尝试解决一个尚没有答案的数学问题，但是它们对于各种次要（但仍与工作相关）任务时非常有效（尽管之后需要一些手动调整）。”

隐私隐患如何解决

目前来看，这些职业是否会被 AI 取代，取决于后者的未来发展，但这毫无疑问会深刻改变我们的生活生产方式。OpenAI 公共政策主管 Anna Makanju 表示：“这项技术将深刻改变我们的生活方式。我们现在仍有时间来指导其发展轨迹、限制滥用并确保最广泛有益的结果。”[6]

除了职业安全问题，我们还需要关心一下自己的隐私。担心“聪明”的 ChatGPT “窃取”用户隐私是一个 AI 诞生起就如形随形的问题，而第三方插件的引入使得这个问题更加复杂——我们难以保证这些插件不会利用 ChatGPT 获得用户隐私来牟利。3 月 20 日，ChatGPT 出了一个几乎引发全网骚动的 bug，一些用户可以在自己的聊天页面里看到他人的聊天记录。OpenAI 不得不将 ChatGPT 强制下线修复[4]，这令大批打工人叫苦不迭。更糟糕的是，ChatGPT 下线的几个小时里，一部分活跃用户的姓名、电子邮件地址、支付地址、信用卡号的最后四位和信用卡到期时间也被泄露，尽管 OpenAI 官方认为泄漏的数据量很少，但如何采取措施确保用户隐私安全将成为所有 AI 公司的首要任务。

如上所述，ChatGPT 这样的 AI 在未来肯定会深刻地影响目前社会的生产生活格局，改变人们的工作生活方式，因此如何确保新的“人+AI”模式顺利进行并对人类社会产生有益影响，对于政策制定者和 AI 公司有着极大的考验。

主要参考资料：

[1]https://writings.stephenwolfram.com/2023/03/chatgpt-gets-its-wolfram-superpowers/

[2]https://openai.com/blog/chatgpt-plugins

[3]https://arxiv.org/pdf/2303.10130.pdf

[4]https://twitter.com/OpenAI/status/1639297361729191936

[5]https://openai.com/blog/march-20-chatgpt-outage

[6]https://openai.com/safety

[7]https://mathstodon.xyz/@tao

本文来自微信公众号“科研圈”。如需转载，请在“科研圈”后台回复“转载”，或通过公众号菜单与我们取得联系。相关内容禁止用于营销宣传。封面图来源：Pixabay。

▽ 精彩回顾 ▽