Nature给学术界立规矩:ChatGPT等大模型不可以成为作者

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>CV微信技术交流群

转载自:机器之心  |  编辑:蛋酱

随着研究人员不断涌入先进的 AI 聊天机器人的「新世界」,像《Nature》这样的出版商需要承认它们的合法用途,并制定明确的指导方针以避免滥用。

几年来,人工智能正在获得生成流畅语言的能力,开始大量制造越来越难以与人类生成文本区分的句子。一些科学家很早就在使用聊天机器人作为研究助手,帮助组织自己的思维,生成对自身工作的反馈,协助编写代码以及对研究文献进行摘要。

但在 2022 年 11 月发布的 AI 聊天机器人 ChatGPT,正式将这种被称为大型语言模型的工具能力带给了大众。其研发机构 —— 位于旧金山的初创公司 OpenAI 提供了这款聊天机器人的免费使用权限,即使不具备技术专长的人也能轻松使用。

数以百万计的人正在使用它,生成结果有时是有趣的、有时是可怕的。「AI 写作实验」的爆炸性增长,让人们对这些工具越来越感到兴奋和不安。

ChatGPT 超能力的喜与忧

ChatGPT 可以写出漂亮的学生作文、总结研究论文、回答问题、生成可用的计算机代码,甚至足以通过医学考试、MBA 考试、司法考试等。

前段时间,ChatGPT 在一项实验中已经「接近」通过美国医学执照考试(USMLE)。一般来说,这需要四年的医学院学习和两年以上的临床经历才能通过。

e41139526afbf0f41a89e810e0208707.png

  • Step 1 是在医学院学习 2 年后进行,包括基础科学、药理学和病理生理学。学生平均学习 300 多个小时才能通过。

  • Step 2 是在医学院 4 年 + 1.5-2 年的临床经历后进行的,包括临床推断和医疗管理。

  • Step 3 是由完成了 0.5-1 年的研究生医学教育的医生参加。

ChatGPT 还成功通过了沃顿商学院的 MBA 运营管理期末考试。当然,这种考试并不是最难的问题,但在 1 秒钟内完成必须算是「突破性」的。

bc1d65f1816e8e6b67e9db1e6d9fe957.png

cd272059cd8d9fcbfc1d79f58df02d34.png

766271d2ea82ac22b5c9de9c8bcdbe92.jpeg

在司法考试这件事上,ChatGPT 仍然展现出了非凡的能力。在美国,要想参加律师专业执照考试,大多数司法管辖区要求申请人完成至少七年高等教育,包括在经认可的法学院学习三年。此外,大多数应试者还需要经过数周至数月的考试准备。尽管投入了大量的时间和资金,大约 20% 的应试者在第一次考试中的得分仍然低于通过考试的要求。

但在最近的一项研究中,研究者发现,对于最佳 prompt 和参数,ChatGPT 在完整的 NCBE MBE 练习考试中实现了 50.3% 的平均正确率,大大超过了 25% 的基线猜测率,并且在证据和侵权行为方面都达到了平均合格率。ChatGPT 的答案排名也与正确率高度相关;其 Top 2 和 Top 3 的选择分别有 71% 和 88% 的正确率。作者认为,这些结果强烈表明大型语言模型将在不久的将来通过律师资格考试的 MBE 部分。

9cf38564ae1824f984051ed5be51df6d.png

2261be4657f01ee7bc88ed764dca86a4.png

ChatGPT 编写的研究摘要水平也很高,以至于科学家们发现很难发现这些摘要是由计算机编写的。反过来说,对整个社会来说,ChatGPT 也可能使垃圾邮件、勒索软件和其他恶意输出更容易产生。

目前为止,语言模型生成的内容还不能完全保证其正确性,甚至在一些专业领域的错误率是很高的。如果无法区分人工编写内容和 AI 模型生成内容,那么人类将面临被 AI 误导的严重问题。尽管 OpenAI 试图为这款聊天机器人的行为设限,但用户已经找到了绕过限制的方法。

学术界的担心

学术研究界最大的担忧是,学生和科学家可以欺骗性地把大模型写的文本当作自己写的文本,或者以简单化的方式使用大模型(比如进行不完整的文献综述),生成一些不可靠的工作。

在近期西北大学 Catherine Gao 等人的一项研究中,研究者选取一些发表在美国医学会杂志(JAMA)、新英格兰医学杂志(NEJM)、英国医学期刊(BMJ)、《柳叶刀》和《Nature Medicine》上的人工研究论文,使用 ChatGPT 为论文生成摘要,然后测试审稿人是否可以发现这些摘要是 AI 生成的。

实验结果表明,审稿人仅正确识别了 68% 的生成摘要和 86% 的原始摘要。他们错误地将 32% 的生成摘要识别为原始摘要,将 14% 的原始摘要识别为 AI 生成的。审稿人表示:「要区分两者出奇地困难,生成的摘要比较模糊,给人一种公式化的感觉。」

甚至还有一些预印本和已发表的文章已经将正式的作者身份赋予 ChatGPT。一些学术会议率先公开反对,比如机器学习会议 ICML 就表示过:「ChatGPT 接受公共数据的训练,这些数据通常是在未经同意的情况下收集的,这会带来一系列的责任归属问题。」

因此,现在或许是研究人员和出版商制定以道德方式使用大型语言模型的基本规则的时候了。《自然》杂志公开表示,已经与所有 Springer Nature 期刊共同制定了两条原则,并且这些原则已被添加到现有的作者指南中:

首先,任何大型语言模型工具都不会被接受作为研究论文的署名作者。这是因为任何作者的归属权都伴随着对工作的责任,而 AI 工具不能承担这种责任。

第二,使用大型语言模型工具的研究人员应该在方法或致谢部分记录这种使用。如果论文不包括这些部分,可以用引言或其他适当的部分来记录对大型语言模型的使用。

39ffce2178e149c209efc7f18e28ef03.png

作者指南:https://www.nature.com/nature/for-authors/initial-submission

通讯作者应以星号标明。大型语言模型(LLM),如 ChatGPT,目前不符合我们的作者资格标准。值得注意的是,作者的归属带有对工作的责任,这不能有效地适用于 LLM。LLM 的使用应该在稿件的方法部分(如果没有方法部分,则在合适的替代部分)进行适当记录。

据了解,其他科学出版商也可能采取类似的立场。「我们不允许 AI 被列为我们发表的论文的作者,并且在没有适当引用的情况下使用 AI 生成的文本可能被视为剽窃,」《Science》系列期刊的主编 Holden Thorp 说。

为什么要制定这些规则?

编辑和出版商可以检测由大型语言模型生成的文本吗?现在,答案是「或许可以」。如果仔细检查的话,ChatGPT 的原始输出是可以被识别出来的,特别是当涉及的段落超过几段并且主题涉及科学工作时。这是因为,大型语言模型是根据它们的训练数据和它们所看到的 prompt 中的统计学关联来生成词汇模式的,这意味着它们的输出可能看起来非常平淡,或者包含简单的错误。此外,它们还不能引用资料来记录他们的输出。

但在未来,人工智能研究人员也许能够解决这些问题 —— 例如,已经有一些实验将聊天机器人与引用资源的工具联系起来,还有一些实验用专门的科学文本训练聊天机器人。

一些工具声称可以检测出大型语言模型生成的输出,《自然》杂志的出版商 Springer Nature 就是开发这项技术的团队之一。但是大型语言模型将会迅速改进。这些模型的创建者希望能够以某种方式为其工具的输出添加水印,尽管这在技术上可能不是万无一失的。

457f2ec3c827ae0ee3ffa04629ed50d2.png

近期较火的一篇为大型语言模型输出添加「水印」的论文。论文地址:https://arxiv.org/pdf/2301.10226v1.pdf

从最早的时候起,「科学」就主张对方法和证据公开透明,无论当时流行的是哪种技术。研究人员应该扪心自问,如果他们或他们的同事使用的软件以一种根本不透明的方式工作,那么产生知识的过程所依赖的透明度和可信度如何保持。

这就是为什么《自然》杂志制定了这些原则:最终,研究方法必须透明,作者必须诚实、真实。毕竟,这是科学赖以发展的基础。

参考链接:

https://www.nature.com/articles/d41586-023-00191-1

https://www.nature.com/articles/d41586-023-00107-z

点击进入—>CV微信技术交流群

CVPR/ECCV 2022论文和代码下载

 

后台回复:CVPR2022,即可下载CVPR 2022论文和代码开源的论文合集

后台回复:ECCV2022,即可下载ECCV 2022论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲扫码或加微信号: CVer222,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3820.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT作者John Shulman:我们成功的秘密武器

推荐:深度学习与NLP 来源:转载自OneFlow,杨婷、徐佳渝翻译 除了OpenAI,外界可能很少有人知道ChatGPT模型成功的真正原因,实际上,OpenAI也会对ChatGPT拥有的巨大影响力感到不可思议。这种困惑和惊喜就像工程…

卖AI社群,狂赚400万!第一批用 ChatGPT 搞副业人,暴富了!

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) 先给你讲两个故事: 我的一位同行,情况跟我很相似,主业是某互联网大厂高管,副业做自媒体,做得比K哥好,已经是行业头部了。ChatGPT…

微信机器人,微信聊天机器人搭建教程附源代码

准备工具 https://www.tianapi.com/apiview/47 注册天行机器人 http://wechat.aibotk.com/oapi/oapi 注册智能微秘书 https://download.csdn.net/download/m0_67521202/86427740 源代码下载 以上步骤完成之后登录智能微秘书 打开以下页面输入天行机器人的API 完成后保…

Wechaty创建属于自己的微信机器人(附源码)

1.微信机器人常用开源框架 itchat itchat是一个开源的微信个人号接口,基于python调用微信使用不到三十行的代码,你就可以完成一个能够处理所有信息的微信机器人wechaty Wechaty是适用于微信个人的Bot SDK ,可以使用6行 js 创建一个机器人具有…

微信机器人的构建与使用

一个不知名大学生,江湖人称菜狗 original author: jacky Li Email : 3435673055qq.com Time of completion:2022.12.15 Last edited: 2022.12.17 目录 《微信机器人》程序使用说明 微信机器人使用说明 1.项目说明 2. 系统环境 3.准备条…

企业微信机器人读取服务器,用企业微信机器人搞事情

从把办公通信工具从微信迁移到企业微信后,群组里面多了一个叫“群聊机器人”的功能,如下图,我在某个群建了一个叫“测试”的机器人。 听名字会让人以为群里面有个能自动答复的机器人,它就能跟他对话。其实并不能,他的功…

青龙->微信机器人 搭建保姆级教程

群晖上搭建青龙搭建微信机器人 保姆级教程 准备环境安装docker群晖套件的docker安装在虚拟机linux中安装docker docker中安装青龙面板(面板版本推荐2.10.13)套件的docker中安装青龙虚拟机linux中安装青龙 创建应用 搭建傻妞.配置傻妞 安装并且对接VLWhttpApi插件的安装和配置傻…

微信机器人 DIY 从 0 到 1

这标题多少有点儿不恰当——本文重点其实是介绍微信机器人的一个传输通道,机器人部分不会涉及太多。不过话说回来,哪怕只能机械应答,其实也是可以称为机器人的。 本文打算从动机、基本原理、关键技术、具体实现以及应用示例五方面来展开介绍…

微信机器人ipad

首先我们要先了解下ipad协议是什么 ,ipad协议又叫微信协议 是基于微信IPad协议的智能控制系统帮助企业快速连接客户,创造营销氛围,实现自动获客、自动传播、自动转化、智能营销等分布式营销服务。 通过API 实现 个性化微信功能 (例…

微信机器人接入Midjourney

Midjourney 今天下午研究了一下Midjourney,发现画图确实厉害,于是懂了小心思,为了方便使用,直接把他搞到微信上来用用,话不多说,先上图: 为了方便使用,里面还接入了百度翻译的api&a…

搭建微信机器人的方案都在这了!

大家好,我是鸟哥。一个半路出家的程序员。 最近ChatGPT又把微信机器人带火了!我也算是微信机器人的资深玩家,今天也和大家聊聊这个知识点。之前就有小伙伴经常问 搭建微信机器人有哪些框架? 怎么把ChatGPT接入个人微信&#xff…

拂晓·微信机器人

前言 本项目是基于千寻微信框架进行的功能开发,采用SpringBoot青云客机器人进行开发。 千寻初衷是想开源一个框架的写法,并不是为了用来运营,因此功能不全,所以使用和适配前请查看是否与自己需求匹配。 因此本文主要通过千寻客…

别再折腾ChatGpt的微信机器人了,你看到的全是假的

别再折腾ChatGpt的微信机器人了,你看到的全是假的 ChatGPT去年先是在程序员圈子里小众出圈,当时本拐还写了两篇文章: 跟着ChatGPT手把实现一个websocket连接管理器!毛骨悚然 我当PM,把ChatGPT玩冒(b)烟(gōng)了 2023年后&#xf…

0 代码,十分钟搞定微信版 ChatGPT,轻松拥有个性化 AI 助手教程!

大家好,我是贺同学。 最近一周多的时间,只要不是生活在火星,只要你是个正常刷手机的打工人,一定都被 OpenAI 的 ChatGPT 给刷屏了。 看到别人玩的不亦乐乎,想要自己搭建一个机器人玩玩?最好是可私信&#x…

ChatGPT写论文能发表吗?权威期刊回应了!

最近,ChatGPT在社交网络可太太太火了!有关ChatGPT写论文这事也是频频上热搜。依靠ChatGPT强大的语言理解和学习能力,不少网友产生了一个大胆的想法——用ChatGPT来写作业、发论文,岂不美哉!还真有人这么做了。 图片来源…

2023第十三届中国数字营销与电商创新峰会

峰会背景 展望2023年,尽管整体市场环境复杂多变,中国消费市场可能会持续波动,但是,随着防疫政策优化,消费者信心将逐步恢复,中国消费市场依然展现出强劲韧性。 中国的消费者正经历一场前所未有的变革&…

关于AIGC企业出海案例

随着人工智能技术的不断发展,跨境电商行业也开始受到了智能化技术的影响。越来越多的跨境电商企业开始借助生成式AI工具来提升自身的运营效率和竞争力。 下面分享一个AIGC企业出海案例: verycloud与一家国内领先AI技术团队的跨境出海AI内容应用客户达成…

亚马逊云科技跨境电商峰会:重构跨境想象力,赋能出海新机遇

随着数字技术的不断发展和全球市场的快速变化,跨境电商市场呈现出越来越多的机遇和挑战。市场竞争加剧,流量红利减弱,后疫情时代,技术驱动下的创新发展成为企业转型的核心。如何借助数字技术重构跨境电商的想象力,抓住…

GPT-4震撼发布,跨境电商怎么用?带你直观了解GPT-4的升级作用

相信大家今天打开各个平台,大家都在讨论的就是GPT-4了,可谓是又一次刷屏大家的社交平台。东哥今天就来跟大家唠唠Open-AI 刚刚公布的ChatGPT最新版本 ——GPT-4。 GPT-4 的作用以及优缺点 GPT-4确实拥有多模态能力,可以接受图像输入并理解图像…

亚马逊云科技跨境电商峰会,让AI重构跨境想象力

随着数字技术的不断发展和全球市场的快速变化,跨境电商市场呈现出越来越多的机遇和挑战。市场竞争加剧,流量红利减弱,后疫情时代,技术驱动下的创新发展成为企业转型的核心。如何借助数字技术重构跨境电商的想象力,抓住…