离谱!最新研究:61%中国人写的英语论文,会被ChatGPT检测器判为AI生成的

65e1361ec43d724325cd8e09e5df8303.jpeg夕小瑶科技说 分享
来源 | 新智元

ChatGPT火了以后,用法是真多。有人拿来寻求人生建议,有人干脆当搜索引擎用,还有人拿来写论文。论文...可不兴写啊。美国部分大学已经明令禁止学生使用ChatGPT写作业,还开发了一堆软件来鉴别,判断学生上交的论文是不是GPT生成的。这里就出了个问题。有人论文本来就写的烂,判断文本的AI以为是同行写的。更搞的是,中国人写的英文论文被AI判断为AI生成的概率高达61%。

d9725f75b2901170bbf5d27a390baa15.png

这....这这什么意思?气抖冷!

非母语者不配?

目前,生成式语言模型发展迅速,确实给数字通信带来了巨大进步。但滥用真的不少。虽说研究人员已经提出了不少检测方法来区分AI和人类生成的内容,但这些检测方法的公平性和稳定性仍然亟待提高。为此,研究人员使用母语为英语和母语不为英语的作者写的东西评估了几个广泛使用的GPT检测器的性能。研究结果显示,这些检测器始终将非母语者写作的样本错误地判定为AI生成的,而母语写作样本则基本能被准确地识别。此外,研究人员还证明了,用一些简单的策略就可以减轻这种偏见,还能有效地绕过GPT检测器。这说明什么?这说明GPT检测器就看不上语言表达水平不咋地的作者,多叫人生气。不禁联想到那款判断AI还是真人的游戏,如果对面是真人但你猜是AI,系统就会说,「对方可能会觉得你冒犯了。」

不够复杂=AI生成?

研究人员从一个中国的教育论坛上获取了91篇托福作文,又从美国Hewlett基金会的数据集中摘取了88篇美国八年级学生写的作文,用来检测7个被大量使用的GPT检测器。

d8abbeb070b35e726546bfd26f510032.png

图表中的百分比表示「误判」的比例。即,是由人写的,但检测软件认为是AI生成的。可以看到数据非常悬殊。七个检测器中,美国八年级学生写的作文被误判的概率最高才12%,还有两个零误判的GPT。中国论坛上的托福作文被误判的概率基本全部过半,最高误判概率可达76%。91篇托福作文中的18篇被所有7个GPT检测器一致认为是AI生成的,而91篇中有89篇,都至少被一个GPT检测器误判。

f5dd33ea39aca479f71e1080c897195f.png

从上图中我们可以看出,被所有7个GPT误判的托福作文在复杂度(Complexity)上明显低于其它论文。这就印证了开头的那个结论——GPT检测器会对那些语言表达能力有限的作者有一定偏见。因此,研究人员认为,GPT检测器应该多看点儿非母语者写的文章,样本多了,才能消除偏见。接下来,研究人员把非母语者写的托福作文扔到了ChatGPT里,丰富一下语言,模仿母语者的用词习惯。同时作为对照组,把美国八年级小孩儿写的作文也扔到了ChatGPT里,把语言简化了一下,模仿非母语者的写作特点。下图就是修正后的新判定结果。

db2df8263a0b15f5e61b51c454bd19e4.png

我们可以发现,情况来了个大掉个儿,丰富了语言的托福作文错判率直线下降,低至3%,最高也不过19%。不像之前基本全部过半的错判率。与之相反,八年级小孩儿写的作文的错判率直线上升,甚至还有一个GPT检测器的错判率高达99%,基本全错。因为,文章复杂度这个变量出现了变化。

c088c7a5b38c2daabfcfb54ad41beb30.png

这里研究人员就得出了一个结论,非母语者写的东西不地道,复杂度低,容易被错判。这也就导向了一个技术问题,同时也是一个价值问题。以复杂度来判定AI还是人类是作者,是否合理、全面、严谨。结果显然不是。以复杂度为判断标准的情况下,非母语者吃了大亏,因为,他们是非母语者(废话)。

AI润色=人类写的??

研究者认为,加强语言多样性不仅可以减轻对非母语者的偏见,还能让GPT生成的内容绕过GPT检测器。为了证明这个观点,研究人员选取了2022-2023年间美国大学申请的入学论文题目,输入到ChatGPT-3.5里,一共生成了31篇假论文。GPT检测器一开始还挺有效,但是第二轮就不行了。这是因为,在第二轮中,研究人员把这些论文又扔到ChatGPT里润色了一下,用一些文学性的语言提升了文本质量。这样一来,GPT检测器的准确度就从100%直降到了0%。如下图:

960ae55aef578823b8b8d6c4331deeae.png

经过润色的文章复杂度相应也上升了。

a3a2f4b0ca42cb94d5070f59e79b71f2.png

与此同时,研究人员又用了斯坦福大学145个期末项目报告的题目,让ChatGPT生成摘要。

6ba0ef05822a88a416bd0cac9baad71f.png

摘要经过润色以后,检测器判断的准确性继续下降。研究者再次得出结论,润色过的文章很容易被误判,都是AI生成的,两轮就是比一轮强。

GPT检测器?还是欠练

ec08b965e9c780337be7fd8208524ae8.png

言而总之,总而言之,各种GPT检测器好像还是没能抓住AI生成和人类写作之间最本质的区别。人的写作也分三六九等,仅靠复杂度判断,不甚合理。抛开偏见因素不谈,技术本身也亟待改进。

e86ff807c0d21fdeeabbf8da06ba4613.png 2bc0db92e9a2df1ba0f46d358dd12dd0.png

参考资料

[1] https://arxiv.org/pdf/2304.02819

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6505.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MidJourney中国版开放内测;70款ChatGPT插件全评测;盘点181家海外AI创业公司;GPT+科研工作流 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 『左耳朵耗子 | 享受编程和技术带来的快乐』Coding Your Ambition CoolShell 是陈皓创建的技术共享平台,主题非常广泛&…

谷歌急投20亿押注ChatGPT最强竞品,内测效果远超ChatGPT

文|衡宇 源|量子位 谷歌应对ChatGPT的招数,出得越来越急了。最新消息:劈柴哥重磅宣布,斥资3亿美元,投的就是ChatGPT的竞品——还是由GPT-3核心成员出走创办的AI初创公司。 这家公司名叫Anthropic&#xff0…

如何加入bing的chatgpt内测计划

网址: https://www.bing.com/ 登录: 点击‘了解详细信息’: 点击‘加入等待列表’: 加入名单: 如何加快审核: 1)默认浏览器为edge浏览器。 2)默认网址为bing.com作为搜索网。 …

谷歌版 ChatGPT Bard 开放内测申请了!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 上个月初,Google 在巴黎开了一场技术发布会,对外展示一款可用于对抗 ChatGPT 的聊天机器人:Bard。 只可惜,出师未捷身先死,Bard …

阿里版 ChatGPT 突然关闭内测申请!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 4 月 7 日上午,阿里悄然推出了一款与 ChatGPT 类似的产品:通义千问。 不过,目前该产品注册通道已经关闭,只能通过邀请码加入试用。 在产品上…

微软多模态ChatGPT来了?16亿参数搞定看图答题、智商测验等任务

关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 从大型语言模型(LLM)到多模态大型语言模型(MLLM)&am…

ChatGPT王炸更新!能联网获取新知识,可与5000+个应用交互,网友:太疯狂了

都说ChatGPT是AI的“iPhone时刻”,现在属于它的“应用商店”来了。 OpenAI刚刚又甩出一个王炸—— 宣布推出插件功能,赋予ChatGPT使用工具、联网、运行计算的能力。 例如在官方演示中,ChatGPT一旦接入数学知识引擎Wolfram Alpha&#xff0…

AudioGPT推出,音频领域都不放过,ChatGPT这是杀疯了。

3 天前 ChatGPT云炬学长 ​关注 今天和大家介绍的一个项目属于音频领域的ChatGPT的应用实践。真没想不到,在音频领域,ChatGPT都没有放过,ChatGPT这是杀疯了呀! 现在的ChatGPT是一个实打实的风口,也希望大家跟我一起努…

四少女火爆外网,AI杀疯了!

转自:量子位 | 金磊 四位美少女,带着AI画画在ChatGPT的热浪中杀出了一片天地。 新“魔法”一出,瞬间吸引全场目光: 原本是一张四个闺蜜在沙滩边上的普通合影照: 在新魔法的加持下,“啪的一下”画…

ChatGPT ✖️ 前端 = 有点er意思

HOT! HOT! HOT! 🔥 🔥 🔥 ChatGPT登上了国内各大平台的热搜榜,应该在去年11月末的时候就有不少同学了解并使用过,那个时候它刚刚问世,在互联网圈子里有了很大的热度,但是对于大众来说&#xff…

干掉 Google?ChatGPT 这几天杀疯了!

点击关注公众号,Java干货及时送达 推荐阅读: Spring 旗下最牛逼的国产项目! Spring Boot 3.0 正式发布,王炸!! 出品 | OSC开源社区(ID:oschina2013) 人工智能研究公司 OpenAI 上周正…

AudioGPT推出!音频领域都不放过,ChatGPT这是杀疯了!

大家好,我是千与千寻,你们可以叫我千寻哥,算一算写ChatGPT的技术文章已经写到第四篇了! 今天和大家介绍的一个项目属于音频领域的ChatGPT的应用实践。真没想不到,在音频领域,ChatGPT都没有放过,ChatGPT这是杀疯了呀! 现在的ChatGPT是一个实打实的风口,也希望大家跟我…

用ChatGPT面试杀疯了,拿下大厂

集中投了几家公司后,便开始面试,为了节约时间,我选择使用Chatgpt辅助面试,果然是最佳私人助手,就像多了一个贴心秘书! 1、将想要应聘公司的岗位要求,jd复制到Chatgpt 2、问模拟面试官可能问到的…

Stable Diffusion、ChatGPT爆火的背后!

整编 | Carol 参考 |《AIGC 发展趋势报告 2023》 出品 | AI科技大本营 “Generative AI(生成式AI)有什么社会价值?” 当腾讯研究院的研究员将上面这个问题输入到ChatGPT中,得到如下回复: "生成式AI是一种人工智能…

ChatGPT 火爆全球,我们能抓住的下一个风口在哪?

中国互联网行业正面临着巨大的压力和挑战,但也孕育着新的发展机遇。当下正值ChatGPT火爆,整个互联网行业充满了机遇和挑战,身处其中的我们能抓住什么呢? 思你所思,帮大家整理出了五大风口!希望对大家有所帮…

爆火!ChatGPT背后的这类芯片赢麻了!

2022年底,由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT一夜爆火,席卷全球多国及地区。毋庸置疑,ChatGPT火爆出圈得益于高性能计算、人工智能以及半导体等行业技术的飞速发展、不断迭代和有机结合。 该产品以强大的文字处理和人机交…

揭秘ChatGPT背后的传奇崛起,探索其引爆引爆网络的隐藏故事

文章目录 前言一、ChatGPT的诞生背景二、ChatGPT的技术原理三、ChatGPT的推广策略四、ChatGPT的未来展望五、橙子送书第3期 前言 ChatGPT是一款基于人工智能技术的聊天机器人,它的出现引起了广泛的关注和热议。在短短的时间内,ChatGPT就成为了全球范围内…

Spring boot +React集成ChatGPT 智能AI

在这里插入代码片import {Button, Input, Radio,Alert,Modal } from antd; import Marquee from react-fast-marquee; import {ChromeOutlined,WifiOutlined,AimOutlined } from ant-design/icons; import React, {useEffect, useState, useRef} from react; import chatgptPn…

中文调教指南,100个提升ChatGPT输出质量的中文prompts

最近这段时间ChatGPT的风实在是太大了,人工智能带给大家的冲击一波又一波,3月27日,根据高盛(Goldman Sachs)研究报告显示,以ChatGPT为代表的生成式AI产品,将对美国和欧洲三分之二工作岗位造成影…