Nature立新规:ChatGPT等大模型不可以成为作者

点击蓝字

f9c92404d8aff066a81603434d5eb58b.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

内容来自机器之心(ID:almosthuman2014)

随着研究人员不断涌入先进的 AI 聊天机器人的「新世界」,像《Nature》这样的出版商需要承认它们的合法用途,并制定明确的指导方针以避免滥用。

几年来,人工智能正在获得生成流畅语言的能力,开始大量制造越来越难以与人类生成文本区分的句子。一些科学家很早就在使用聊天机器人作为研究助手,帮助组织自己的思维,生成对自身工作的反馈,协助编写代码以及对研究文献进行摘要。

但在 2022 年 11 月发布的 AI 聊天机器人 ChatGPT,正式将这种被称为大型语言模型的工具能力带给了大众。其研发机构 —— 位于旧金山的初创公司 OpenAI 提供了这款聊天机器人的免费使用权限,即使不具备技术专长的人也能轻松使用。

数以百万计的人正在使用它,生成结果有时是有趣的、有时是可怕的。「AI 写作实验」的爆炸性增长,让人们对这些工具越来越感到兴奋和不安。

ChatGPT 超能力的喜与忧

ChatGPT 可以写出漂亮的学生作文、总结研究论文、回答问题、生成可用的计算机代码,甚至足以通过医学考试、MBA 考试、司法考试等。

前段时间,ChatGPT 在一项实验中已经「接近」通过美国医学执照考试(USMLE)。一般来说,这需要四年的医学院学习和两年以上的临床经历才能通过。

fb4288ddd14bc4015f273abfc68d810b.png

  • Step 1 是在医学院学习 2 年后进行,包括基础科学、药理学和病理生理学。学生平均学习 300 多个小时才能通过。

  • Step 2 是在医学院 4 年 + 1.5-2 年的临床经历后进行的,包括临床推断和医疗管理。

  • Step 3 是由完成了 0.5-1 年的研究生医学教育的医生参加。

ChatGPT 还成功通过了沃顿商学院的 MBA 运营管理期末考试。当然,这种考试并不是最难的问题,但在 1 秒钟内完成必须算是「突破性」的。

1f66a80c72018165efe2bfc265c18863.png

0b13285b56d5ba26223882a1a3bd9c7b.png

1a544382cab595176781dd0c6bb7583e.jpeg

在司法考试这件事上,ChatGPT 仍然展现出了非凡的能力。在美国,要想参加律师专业执照考试,大多数司法管辖区要求申请人完成至少七年高等教育,包括在经认可的法学院学习三年。此外,大多数应试者还需要经过数周至数月的考试准备。尽管投入了大量的时间和资金,大约 20% 的应试者在第一次考试中的得分仍然低于通过考试的要求。

但在最近的一项研究中,研究者发现,对于最佳 prompt 和参数,ChatGPT 在完整的 NCBE MBE 练习考试中实现了 50.3% 的平均正确率,大大超过了 25% 的基线猜测率,并且在证据和侵权行为方面都达到了平均合格率。ChatGPT 的答案排名也与正确率高度相关;其 Top 2 和 Top 3 的选择分别有 71% 和 88% 的正确率。作者认为,这些结果强烈表明大型语言模型将在不久的将来通过律师资格考试的 MBE 部分。

4fc14dce3d7f7e3a9567b2f00a5a1630.png

a302b0db273f0a022889d0454ab35c97.png

ChatGPT 编写的研究摘要水平也很高,以至于科学家们发现很难发现这些摘要是由计算机编写的。反过来说,对整个社会来说,ChatGPT 也可能使垃圾邮件、勒索软件和其他恶意输出更容易产生。

目前为止,语言模型生成的内容还不能完全保证其正确性,甚至在一些专业领域的错误率是很高的。如果无法区分人工编写内容和 AI 模型生成内容,那么人类将面临被 AI 误导的严重问题。尽管 OpenAI 试图为这款聊天机器人的行为设限,但用户已经找到了绕过限制的方法。

学术界的担心

学术研究界最大的担忧是,学生和科学家可以欺骗性地把大模型写的文本当作自己写的文本,或者以简单化的方式使用大模型(比如进行不完整的文献综述),生成一些不可靠的工作。

在近期西北大学 Catherine Gao 等人的一项研究中,研究者选取一些发表在美国医学会杂志(JAMA)、新英格兰医学杂志(NEJM)、英国医学期刊(BMJ)、《柳叶刀》和《Nature Medicine》上的人工研究论文,使用 ChatGPT 为论文生成摘要,然后测试审稿人是否可以发现这些摘要是 AI 生成的。

实验结果表明,审稿人仅正确识别了 68% 的生成摘要和 86% 的原始摘要。他们错误地将 32% 的生成摘要识别为原始摘要,将 14% 的原始摘要识别为 AI 生成的。审稿人表示:「要区分两者出奇地困难,生成的摘要比较模糊,给人一种公式化的感觉。」

甚至还有一些预印本和已发表的文章已经将正式的作者身份赋予 ChatGPT。一些学术会议率先公开反对,比如机器学习会议 ICML 就表示过:「ChatGPT 接受公共数据的训练,这些数据通常是在未经同意的情况下收集的,这会带来一系列的责任归属问题。」

因此,现在或许是研究人员和出版商制定以道德方式使用大型语言模型的基本规则的时候了。《自然》杂志公开表示,已经与所有 Springer Nature 期刊共同制定了两条原则,并且这些原则已被添加到现有的作者指南中:

首先,任何大型语言模型工具都不会被接受作为研究论文的署名作者。这是因为任何作者的归属权都伴随着对工作的责任,而 AI 工具不能承担这种责任。

第二,使用大型语言模型工具的研究人员应该在方法或致谢部分记录这种使用。如果论文不包括这些部分,可以用引言或其他适当的部分来记录对大型语言模型的使用。

4ea6a60f39b9b97b2c531cd9408373f6.png

作者指南:https://www.nature.com/nature/for-authors/initial-submission

通讯作者应以星号标明。大型语言模型(LLM),如 ChatGPT,目前不符合我们的作者资格标准。值得注意的是,作者的归属带有对工作的责任,这不能有效地适用于 LLM。LLM 的使用应该在稿件的方法部分(如果没有方法部分,则在合适的替代部分)进行适当记录。

据了解,其他科学出版商也可能采取类似的立场。「我们不允许 AI 被列为我们发表的论文的作者,并且在没有适当引用的情况下使用 AI 生成的文本可能被视为剽窃,」《Science》系列期刊的主编 Holden Thorp 说。

为什么要制定这些规则?

编辑和出版商可以检测由大型语言模型生成的文本吗?现在,答案是「或许可以」。如果仔细检查的话,ChatGPT 的原始输出是可以被识别出来的,特别是当涉及的段落超过几段并且主题涉及科学工作时。这是因为,大型语言模型是根据它们的训练数据和它们所看到的 prompt 中的统计学关联来生成词汇模式的,这意味着它们的输出可能看起来非常平淡,或者包含简单的错误。此外,它们还不能引用资料来记录他们的输出。

但在未来,人工智能研究人员也许能够解决这些问题 —— 例如,已经有一些实验将聊天机器人与引用资源的工具联系起来,还有一些实验用专门的科学文本训练聊天机器人。

一些工具声称可以检测出大型语言模型生成的输出,《自然》杂志的出版商 Springer Nature 就是开发这项技术的团队之一。但是大型语言模型将会迅速改进。这些模型的创建者希望能够以某种方式为其工具的输出添加水印,尽管这在技术上可能不是万无一失的。

5263338d2331d2b8de8fba00a37f9c80.png

近期较火的一篇为大型语言模型输出添加「水印」的论文。论文地址:https://arxiv.org/pdf/2301.10226v1.pdf

从最早的时候起,「科学」就主张对方法和证据公开透明,无论当时流行的是哪种技术。研究人员应该扪心自问,如果他们或他们的同事使用的软件以一种根本不透明的方式工作,那么产生知识的过程所依赖的透明度和可信度如何保持。

这就是为什么《自然》杂志制定了这些原则:最终,研究方法必须透明,作者必须诚实、真实。毕竟,这是科学赖以发展的基础。

参考链接:

https://www.nature.com/articles/d41586-023-00191-1

https://www.nature.com/articles/d41586-023-00107-z

-  关注我们,记得星标  -

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了900多位海内外讲者,举办了逾400场活动,超400万人次观看。

02a41d46618218e935c1c52f170ec4d3.png

我知道你

在看

~

b90965d4ba0c8d80815a5ebecd844979.gif

点击 阅读原文 解锁更多精彩!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12071.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

神奇LLM引擎上线!帮你把GPT-3直接调成ChatGPT

©作者 | 机器之心编辑部 来源 | 机器之心 OpenAI 花几个月完成的事,现在用它直接给你自动化了。 最近一段时间,不论大公司还是开发者都在造大语言模型(LLM),但有人认为,大模型应用的速度有点落后。 为…

ChatGPT颠覆的第三个行业-教育领域

引言:随着人工智能技术的飞速发展,越来越多的行业受到了影响。ChatGPT作为一种领先的自然语言处理技术,在内容创作、在线客服等领域取得了显著的成果。如今,它正开始进入另一个领域——教育。本文将探讨ChatGPT如何改变教育行业&a…

代理服务器没有响应解决方案

有时候不知道为什么,电脑无缘无故设置了代理-,导致无法获取网络连接,怎么解决呢? 进入控制面板界面: 如果打钩了,去掉就好了… 为啥会代理,始终是个谜. 应该是在公司的时候是走的固定id端口上网,回到家后要去掉这个.

“代理服务器出现问题,或者地址有误”解决方案

网上查了很多方法,终于解决了,在此分享一下(前两个方法为通用方法,都不行的话,可以试试第三种方法) 方法一:(windows11版) 打开设置——网络和Internet——找到代理 进…

代理服务器可能有问题,或地址不正确(已解决)

解决代理服务器可能有问题,或地址不正确 1. 问题描述2. 解决方法 1. 问题描述 如果遇到电脑连上wifi,其他应用可以上网(例如可以登录QQ),但是浏览器不能浏览网页,出现代理服务器可能有问题,或地址不正确 这个错误&…

影响HTTP代理稳定的因素有哪些?IP为什么会不稳定?

我们在使用HTTP代理的时候,会遇到还存活时间内,就无法使用的时候,或者直接登录不上HTTP代理,导致我们无法很好完成项目,在挑选厂商的时候,也会经常会看到厂商的说自己的HTTP代理稳定,可见HTTP代…

代理服务器可能有问题,或地址不正确的解决方案

可能是设置了代理服务器的原因。 1.先打开代理服务器设置 2.关闭代理服务器。

解决代理服务器可能有问题,或地址不正确

解决代理服务器可能有问题,或地址不正确 1. 问题描述2. 解决方法 1. 问题描述 如果遇到电脑连上wifi,其他应用可以上网(例如可以登录QQ),但是浏览器不能浏览网页,出现代理服务器可能有问题,或地址不正确 这个错误&…

hgame2023 week1 writeup

#WEEK1 文章目录 RE1、re-test_your_IDA2、re-easyasm3、re-easyenc4、re-a_cup_of_tea5、re-encode pwn1、test_nc2、easy_overflow3、choose_the_seat4、orw5、simple_shellcode crypto1、兔兔的车票2、cr-RSA3、Be Stream4、神秘的电话 web1、Classic Childhood Game2、Gue…

并发,Java核心技术卷

多进程与多线程的区别: 每个进程拥有自己的一整套变量,线程共享数据。所以线程通信更高效,更轻量、创建册小开销小。 1. 什么是线程 1.1 一个单独线程中运行一个任务的简单过程: 1.将执行任务的代码,放在实现Runnab…

武职301-day02

这里写自定义目录标题 软件开发前端最基础的技术三剑客:HTMLCSSJavaScript二维码 搭建后端开发环境创建SpringBoot项目Jar怎么存储呢?创建第一个SpringBoot程序 使用谷歌工具包zxing产生二维码改造工具类,形成网址输入地址和图片路径&#xf…

序列标注/信息抽取任务(持续更新ing…)

诸神缄默不语-个人CSDN博文目录 本文介绍序列标注/信息抽取任务。 我写了个信息抽取经典论文的石墨文档,但是我发现现在公开发布需要会员了,请大家加我V给我赞助一笔会员费,让我能够公开文档: 最近更新时间:2023.7…

用uiautomator2实现微信发消息自动化

目录 介绍配置环境uiautomator2常用api 操作步骤adb连接手机启动uiautomator2,安装atx-agent启动weditor 微信发消息demo 介绍 Android UI自动化测试框架,提供了屏幕模拟点击的方法如点击、长按、输入、滑动等; uiautomator2与uiautomator&…

Android实现实时视频聊天功能|源码 Demo 分享

疫情期间,很多线下活动转为线上举行,实时音视频的需求剧增,在视频会议,在线教育,电商购物等众多场景成了“生活新常态”。 本文将教你如何通过即构ZEGO 音视频 SDK 在Android端搭建实时视频通话能力。即构音视频SDK提…

写一个 ChatGPT token 编解码 Node.js 服务【含源码】

背景介绍 最近做了一个 ChatGPT 相关的项目 - Ai 玩伴,这是一个微信小程序。Ai 玩伴是基于OpenAI 的 GPT-3.5 语言模型,搭建富有性格特色的「Ai 玩伴」智能聊天机器人。它可以陪你聊天、陪你玩、为你解答各种问题,具体功能可以微信中搜索【A…

解决captcha验证码无法显示的问题

新装的Linux服务器,安装好了JDK1.6,却未设置JAVA_HOME,想不到这为此问题埋下了诱因。 在旧服务器上captcha的验证码没有任何问题。 问题描述: 1.跟踪log,发现servlet调用已经进来了,而且生成验证码的代码也已经走到了…

TP5.1 captcha 验证码刷新不出来(图片显示不了)

captcha 验证码安装路径: 解决办法: 2.打开文件后,加入 ob_clean(); 再次刷新页面就好了

谷歌验证码无法显示问题

解决方案 Google 人机验证(reCaptcha)无法显示解决方案(可解决大多数 CSP 问题) – Azure Zeng Blog 对于Edge,获取Header Editer的方式如下 注意点,Header Editer下载规则时候,需要把解决方案中的网址敲到URL的输入框里

谷歌验证码收不到 / Kaggle注册时无法验证 - 解决方案

谷歌验证码收不到 / Kaggle注册时无法验证 - 解决方案 前言问题解决方案 前言 科研时,需要注册或登录很多(Foreign)网站,极有可能发生谷歌验证码收不到的情况,本文以Kaggle网站为例介绍解决方案。 问题 Kaggle网址&…