离谱。最新研究:61%中国人写的英语论文,会被ChatGPT检测器判为AI生成的

 

640?wx_fmt=jpeg&wxfrom=5&tp=wxpic&wx_lazy=1&wx_co=1

 


 

  新智元报道  

 

【导读】非母语者写的文章=AI生成?气抖冷。

ChatGPT火了以后,用法是真多。

有人拿来寻求人生建议,有人干脆当搜索引擎用,还有人拿来写论文。

论文...可不兴写啊。

美国部分大学已经明令禁止学生使用ChatGPT写作业,还开发了一堆软件来鉴别,判断学生上交的论文是不是GPT生成的。

这里就出了个问题。

有人论文本来就写的烂,判断文本的AI以为是同行写的。

更搞的是,中国人写的英文论文被AI判断为AI生成的概率高达61%。

640?wx_fmt=png&tp=wxpic&wxfrom=5&wx_lazy=1&wx_co=1

这....这这什么意思?气抖冷!

非母语者不配?

目前,生成式语言模型发展迅速,确实给数字通信带来了巨大进步。

但滥用真的不少。

虽说研究人员已经提出了不少检测方法来区分AI和人类生成的内容,但这些检测方法的公平性和稳定性仍然亟待提高。

为此,研究人员使用母语为英语和母语不为英语的作者写的东西评估了几个广泛使用的GPT检测器的性能。

研究结果显示,这些检测器始终将非母语者写作的样本错误地判定为AI生成的,而母语写作样本则基本能被准确地识别。

此外,研究人员还证明了,用一些简单的策略就可以减轻这种偏见,还能有效地绕过GPT检测器。

这说明什么?这说明GPT检测器就看不上语言表达水平不咋地的作者,多叫人生气。

不禁联想到那款判断AI还是真人的游戏,如果对面是真人但你猜是AI,系统就会说,「对方可能会觉得你冒犯了。」

不够复杂=AI生成?

研究人员从一个中国的教育论坛上获取了91篇托福作文,又从美国Hewlett基金会的数据集中摘取了88篇美国八年级学生写的作文,用来检测7个被大量使用的GPT检测器。

640?wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1&tp=wxpic

图表中的百分比表示「误判」的比例。即,是由人写的,但检测软件认为是AI生成的。

可以看到数据非常悬殊。

七个检测器中,美国八年级学生写的作文被误判的概率最高才12%,还有两个零误判的GPT。

中国论坛上的托福作文被误判的概率基本全部过半,最高误判概率可达76%。

91篇托福作文中的18篇被所有7个GPT检测器一致认为是AI生成的,而91篇中有89篇,都至少被一个GPT检测器误判。

640?wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1&tp=wxpic

从上图中我们可以看出,被所有7个GPT误判的托福作文在复杂度(Complexity)上明显低于其它论文。

这就印证了开头的那个结论——GPT检测器会对那些语言表达能力有限的作者有一定偏见。

因此,研究人员认为,GPT检测器应该多看点儿非母语者写的文章,样本多了,才能消除偏见。

接下来,研究人员把非母语者写的托福作文扔到了ChatGPT里,丰富一下语言,模仿母语者的用词习惯。

同时作为对照组,把美国八年级小孩儿写的作文也扔到了ChatGPT里,把语言简化了一下,模仿非母语者的写作特点。下图就是修正后的新判定结果。

640?wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1&tp=wxpic

我们可以发现,情况来了个大掉个儿,丰富了语言的托福作文错判率直线下降,低至3%,最高也不过19%。不像之前基本全部过半的错判率。

与之相反,八年级小孩儿写的作文的错判率直线上升,甚至还有一个GPT检测器的错判率高达99%,基本全错。

因为,文章复杂度这个变量出现了变化。

640?wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1&tp=wxpic

这里研究人员就得出了一个结论,非母语者写的东西不地道,复杂度低,容易被错判。

这也就导向了一个技术问题,同时也是一个价值问题。以复杂度来判定AI还是人类是作者,是否合理、全面、严谨。

结果显然不是。

以复杂度为判断标准的情况下,非母语者吃了大亏,因为,他们是非母语者(废话)。

AI润色=人类写的??

研究者认为,加强语言多样性不仅可以减轻对非母语者的偏见,还能让GPT生成的内容绕过GPT检测器。

为了证明这个观点,研究人员选取了2022-2023年间美国大学申请的入学论文题目,输入到ChatGPT-3.5里,一共生成了31篇假论文。

GPT检测器一开始还挺有效,但是第二轮就不行了。这是因为,在第二轮中,研究人员把这些论文又扔到ChatGPT里润色了一下,用一些文学性的语言提升了文本质量。

这样一来,GPT检测器的准确度就从100%直降到了0%。如下图:

经过润色的文章复杂度相应也上升了。

与此同时,研究人员又用了斯坦福大学145个期末项目报告的题目,让ChatGPT生成摘要。

摘要经过润色以后,检测器判断的准确性继续下降。

研究者再次得出结论,润色过的文章很容易被误判,都是AI生成的,两轮就是比一轮强。

GPT检测器?还是欠练

言而总之,总而言之,各种GPT检测器好像还是没能抓住AI生成和人类写作之间最本质的区别。

人的写作也分三六九等,仅靠复杂度判断,不甚合理。

抛开偏见因素不谈,技术本身也亟待改进。

参考资料:

https://arxiv.org/pdf/2304.02819.pdf

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39565.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

巴比特 | 元宇宙每日必读:微软、迪士尼等撤退之际,Meta却重申元宇宙是一项长期事业,未来计算平台的核心是元宇宙,并将坚持下去...

摘要:据财联社报道,周三,Meta在其Horizon Workrooms平台的一个虚拟空间中召开了一场问答会。其全球事务负责人Nick Clegg再次重申,未来计算平台的核心将会是元宇宙,Meta将坚持下去,但这需要一些时间。当此之…

托业考试要准备什么资料【zhasite】

考生考托业,做好准备工作是很有必要的,zhasite托业网校老师介绍说,托业考试是考生比较关心的一种考试,在考前准备好资料是很有必要的,接下来我们就对托业考试资料为您做一个详细的介绍。 托业考试要准备什么资料? zha…

软考英语部分答题技巧

英语答题技巧 1背单词只有熟悉了相关单词,不说我们能完全翻译句子,但至少我们能够知道这道题目考查的是什么,这样就算连蒙带猜,也能八九不离十。 如果有时间,拿个笔记本,把教材上的英文单词全部抄写一遍下…

PCTA考前辅导

目录 TiDB功能与特点 TiDB Server功能 TiDB Server模块 TiDB Server GC机制 TiDB Server缓存 TiKV RocksDB TiKV RocksDB读写 TiKV MVCC TiKV读写 TiKV Coprocessor PD TSO PD label 数据读取必须步骤 Online DDL 满足HTAP的场景 TiDB数据库的MPP功能特性 T…

【托业】新托业全真题库---TEST1

clearly indicate ——clearly可以修饰indicate(表明;暗示;指示) recently只用于现在完成时和过去完成时中 municipal gallery 市立美术馆 permanently 永久地 nearly 和approximately 具有“大约;大概”的含义的副词&…

足不出户怎么在家赚钱,暑假在家别闲着,给自己赚点生活费吧

在当今快节奏的现代生活中,人们面临着越来越大的竞争压力。为了过上舒适的生活、提前退休、创业或增加收入,许多人都希望能够在家中赚钱。那么,在家里如何可以找到赚钱的项目呢?本文将为您详细介绍一些方法。 一、在家工作有很多好…

加速超级个体,携手迈向 Web3.0 新纪元,峻海资本与 Mixlab 无界社区达成战略合作...

我们正生存在一个比以往都更接近于「未来」的时代,技术壁垒降低带来的可能性在每一个个体面前平等地展开。面对新的未知的技术,你是选择固步自封?还是往前一步? 当有些人还在按部就班地「刻苦」学习写作、绘画、剪辑技能时&#x…

Postgresql无法通过PGAdmin4连接应用程序服务器

Postgresql无法通过PGAdmin4连接应用程序服务器 通过下载的postgresql进行安装后,pgadmin打不开 把原先版本卸载后安装,还是以上问题,分别试了,13,15,均出现,postgresql能正常运行,但pgadmin不可以联接,网上有说需单独安装,我又试了试,记录如下:

kettle开发-Day38-其实chatGPT一直在身边

前言: 最近chatGPT火出圈,其实不是chatGPT多智能,只是它用了一种新的交互方式来组织我们现有的知识,然后通过“高智商”的表达来使我们惊艳。但是目前或者未来的人工智能缺少创造力,他们只会整合信息目的是提高我们的效…

阿里国际站P4P直通车玩法

首先大部分人or大部分老板对于P4P的想法就是,我怎么花最少的直通车创造最多的点击和曝光? 这是很正常的,对于直通车,我们大多数都是平民玩家,不像有些店铺,一天就是几百一千的烧,当然玩不过他们…

python获取阿里巴巴国际站商家信息

帮一个做外贸的朋友搞的,他需要电话号去和商家沟通,提供国际货运一条龙服务,不停地切换页面查看手机号,比较麻烦,帮他写个脚本,一次性获取下来,存成Excel。现在分享一下过程,同时记录…

阿里巴巴国际站业务如何写出高效便捷的客户开发跟进邮件?

阿里巴巴国际站客户开发商务邮件该如何写?? 以下是我个人的一些小经验,希望对大家有所帮助。 对于有知识基础的外贸业务同学,特别是大学就是这方向的专业的同学,如果不是有其他的明确方向,我建议是可以看看…

阿里巴巴国际站组合标题的小技巧

首先按照我之前说的,通过引流关键词or关键词指数下载到平台上的关键词,然后得到Excel,那么现在打开,随便以bags为例,下载得到的词表里面是按照热度排列的, 词的长短不一,不方便我们组合标题&…

业界标杆,直达P8,阿里巴巴面试参考指南(2022泰山版)发布

阿里巴巴面试参考指南(2022泰山版) 全篇共计分为以下七个部分: 阿里巴巴:设计模式与最佳实践阿里巴巴:高并发编程阿里巴巴:数据库阿里巴巴:分布式阿里巴巴:中间件阿里巴巴&#xff…

阿里巴巴中国站获得店铺详情 API 返回值说明

请求地址: https://api-gw.onebound.cn/1688/seller_info 名称类型必须描述keyString是调用key(必须以GET方式拼接在URL中)secretString是调用密钥api_nameString是API接口名称(包括在请求地址中)[item_search,item_get,item_sea…

阿里巴巴国际站如何查看优秀同行产品关键词方法?

阿里巴巴国际站如何查看优秀同行产品关键词方法? 最近事情有点多,所以一直没来更新文章,希望忙过这段时间能有更多时间来写文章和大家分享。 自从我在之前的文章 2021阿里巴巴国际站产品关键词来源(一)中提到阿里国际…

阿里巴巴国际站关键词的收集

hi,4月份快要过去,大家的数据有涨吗? 最近的自然点击和自然曝光已经快追上TOP了,询盘TM也有增长在稳步上升。 说回正题,如何找到应对自己产品的关键词? 你要的都在数据管家-关键词指数里。搜索自家产品&a…

阿里巴巴国际站平台上,大家最容易忽视的问题!

01.产品成长管理,优化分数到达实力优品 大家平台上有挺多76-78,甚至79分数的产品,只要稍微优化下上面提示的指标即可。但很多人是没有去做的,因为很多是老产品,而实力优品的考核,一些新指标出现&#xff0…

阿里巴巴国际站产品标题的组合和优化方法一览

发产品这件事情上,到底什么问题最困扰你?答案肯定是:关键词和产品标题! 无论是刚入门的运营小白还是操作多年的大神,每天要做的事情就是发产品,那在发产品这件事情上,到底什么问题最困扰你&…

阿里巴巴国际站之关键词整理

这是我在知乎上看到的关于阿里巴巴国际站关键词收集整理的文章。现转载过来和大家分享,我觉得这位运营很实在,这也是我喜欢他的文章的原因。 今天和大家讲讲关键词的收集,想跳出的朋友先别着急,请耐心看下去。 说到关键词来源&a…