识别「ChatGPT造假」,效果超越OpenAI:北大、华为的AI生成检测器来了

本文来源  机器之心编辑部

AI 造假的成功率很高,前几天「10 分钟骗 430万」还上了热搜。在最热门的大语言模型上,研究人员最近探索了一种识别方法。

随着生成式大模型的不断进步,它们生成的语料正逐步逼近人类。虽然大模型正在解放无数文书的双手,它以假乱真的强劲能力也为一些不法分子所利用,造成了一系列社会问题:

15524704dbe6ccf65a0e8f265300249b.jpeg

f98f0c3ec9c6db062fee9444ff7088c5.png

7c1574242fc941f0a49220116f2b2e48.jpeg

来自北大、华为的研究者们提出了一种识别各式 AI 生成语料的可靠文本检测器。根据长短文本的不同特性,提出了一种基于 PU 学习的多尺度 AI 生成文本检测器训练方法。通过对检测器训练过程的改进,在同等条件下能取得在长、短 ChatGPT 语料上检测能力的可观提升,解决了目前检测器对于短文本识别精度低的痛点。

bfb2d9f711ff3b65a723f71df9143fd3.jpeg

  • 论文地址:https://arxiv.org/abs/2305.18149

  • 代码地址 (MindSpore):https://github.com/mindspore-lab/mindone/tree/master/examples/detect_chatgpt

  • 代码地址 (PyTorch):https://github.com/YuchuanTian/AIGC_text_detector

引言

随着大语言模型的生成效果越发逼真,各行各业迫切需要一款可靠的 AI 生成文本检测器。然而,不同行业对检测语料的要求不同,例如在学术界,普遍需要对大段完整的学术文本进行检测;在社交平台上,需要对相对简短而较为支离破碎的假消息进行检测。然而,既有检测器往往无法兼顾各式需求。例如,主流的一些 AI 文本检测器对较短的语料预测能力普遍较差。

对于不同长度语料的不同检测效果,作者观察到较短的 AI 生成文本可能存在着一部分归属上的「不确定性」;或者更直白地说,由于一些 AI 生成短句同时也常常被人类使用,因而很难界定 AI 生成的短文本是否来自于人或 AI。这里列举了几个人和 AI 分别对同一问题做出回答的例子:

eaa52a0e3280769abf7ba2a262cba1e6.jpeg

由这些例子可见,很难对 AI 生成的简短回答进行识别:这类语料与人的区别过小,很难严格判断其真实属性。因此,将短文本简单标注为人类 / AI 并按照传统的二分类问题进行文本检测是不合适的。

针对这个问题,本研究将人类 / AI 的二分类检测部分转化为了一个部分 PU(Positive-Unlabeled)学习问题,即在较短的句子中,人的语言为正类(Positive),机器语言为无标记类(Unlabeled),以此对训练的损失函数进行了改进。此改进可观地提升了检测器在各式语料上的分类效果。

算法细节

在传统的 PU 学习设定下,一个二分类模型只能根据正训练样本和无标记训练样本进行学习。一个常用的 PU 学习方法是通过制定 PU loss 来估计负样本对应的二分类损失:

6c56c86f2eef278f8151cf507d9006bd.jpeg

其中,8fe9070532b4ed1e32a24e1f382c2485.jpeg表示正样本与正标签计算的二分类损失;81c886df21dc0de3c8af4dc19f368947.jpeg表示将无标记样本全部假定为负标签计算的二分类损失;6c69a889e39f55e4c2294061c3fff798.jpeg表示将正样本假定为负标签计算的二分类损失;9f56140c5948beb3d105c202bf6a04fa.jpeg表示的是先验正样本概率,即正样本在全部 PU 样本中的预估占比。在传统的 PU 学习中,通常将先验6dd595e9ca1bf4c9225c42eb008180f0.jpeg设置为一个固定的超参数。然而在文本检测的场景中,检测器需要处理各式长度不同的文本;而对于不同长度的文本而言,其正样本在所有和该样本相同长度的 PU 样本中的预估占比也是不同的。因此,本研究对 PU Loss 进行了改进,提出了长度敏感的多尺度 PU(MPU)loss 损失函数。

具体地,本研究提出了一个抽象的循环模型对较短文本检测进行建模。传统的 NLP 模型在处理序列时,通常是一个马尔可夫链的结构,如 RNN、LSTM 等。此类循环模型的这个过程通常可以理解为一个逐渐迭代的过程,即每个 token 输出的预测,都是由上一个 token 及之前序列的预测结果和该 token 的预测结果经过变换、融合得到的。即以下过程:

4744ade2405d67fdec22f85435ec03d6.jpeg

为了根据这个抽象的模型进行先验概率的估计,需要假定该模型的输出为某个句子为正类(Positive)的置信度,即判定为人说出的样本的概率。假设每个 token 的贡献大小为句子 token 长度的反比,是非正(Positive)即无标记(Unlabeled)的,且为无标记的概率远远大于为正的概率。因为随着大模型的词汇量逐渐逼近人类,绝大部分词汇会同时出现在 AI 和人类语料中。根据这个简化后的模型和设定好的正 token 概率,通过求出不同输入情况下模型输出置信度的总期望,来得到最终的先验估计。

4523ae95825e07ee72e1548cc1b809a8.jpeg

通过理论推导和实验,估计得到先验概率随着文本长度的上升而上升,最终逐渐稳定。这种现象也符合预期,因为随着文本变长,检测器可以捕捉的信息更多,文本的 「来源不确定性」也逐渐减弱:

9a06852eec489b18f030531f4ff5a8f4.jpeg

之后,对于每个正样本,根据其样本长度得到的独特先验对 PU loss 进行计算。最后,由于较短文本仅有部分 “不确定性”(即较短文本也会含有一些人或者 AI 的文本特征),可以对二分类 loss 和 MPU loss 进行加权相加,作为最终的优化目标:

fb0b446f5c951bce1f5592371324284d.jpeg

此外需要注意的是,MPU loss 适配的是长度较为多样的训练语料。倘若既有的训练数据单质化明显,大部分语料为大段冗长的文本,则无法全面发挥 MPU 方法的功效。为了使得训练语料的长度更多样化,本研究还引入了一个在句子层面进行多尺度化的模块。该模块随机遮盖训练语料中的部分句子,并对余下句子在保留原有顺序的前提下进行重组。经过训练语料的多尺度化操作,训练文本得到了长度上的极大丰富,从而充分利用了 PU 学习进行 AI 文本检测器训练。

实验结果

8449ea6096f7ef7ce314aaabd6b84345.jpeg

如上表所示,作者先在较短的 AI 生成语料数据集 Tweep-Fake 上检验 MPU loss 的效果。该数据集中的语料均为推特上较为短小的语段。作者又在传统的语言模型微调基础上将传统二分类 loss 替换为含有 MPU loss 的优化目标。改进之后的语言模型检测器效果较为突出,超过了其它基线算法。

929bc4a0ab2d6655be7beaad667142a9.jpeg

作者又对 chatGPT 生成文本进行了检测,经过传统微调得到的语言模型检测器在短句上表现较差;经过 MPU 方式在同等条件下训练得到的检测器在短句上表现良好,且同时能够在完整语料上取得可观的效果提升,F1-score 提升了 1%,超越了 OpenAI 和 DetectGPT 等 SOTA 算法。

feac0c52a1dcd53a57d809ce14052c45.jpeg

如上表所示,作者在消融实验中观察了每个部分带来的效果增益。MPU loss 加强了长、短语料的分类效果。

707d9b3cc377cb27b2a956a16a7f4d12.jpeg

作者还对比了传统 PU 和 Multiscale PU(MPU)。由上表可见 MPU 效果更胜一筹,能更好地适配 AI 多尺度文本检测的任务。

总结

作者通过提出基于多尺度 PU 学习的方案,解决了文本检测器对于短句识别的难题,随着未来 AIGC 生成模型的泛滥,对于这类内容的检测将会越来越重要。这项研究在 AI 文本检测的问题上迈出了坚实的一步,希望未来会有更多类似的研究,把 AIGC 内容进行更好的管控,防止 AI 生成内容的滥用。

关注公众号【机器学习与AI生成创作】,更多精彩等你来读:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

深入浅出ControlNet,一种可控生成的AIGC绘画生成算法! 

经典GAN不得不读:StyleGAN

c6f7bb30ec3124917a6a4b6f05844a59.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7404.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

剽窃、作弊,ChatGPT竟偷偷生成了12篇署名论文!Marcus炮轰Ta变成CheatGPT

视学算法报道 编辑:David 昕朋 【导读】近日,ChatGPT成共同作者的事闹得沸沸扬扬,马库斯也来插一脚。面对使用ChatGPT剽窃论文、把它列为共同作者等现象,马库斯怒怼:别署它名! 马库斯又来怼ChatGPT了&…

ChatGPT transformer 5篇经典论文以及代码和解读

一次性读懂ChatGPT的技术演进路线,根据李沐老师推荐的5篇经典论文,整理了论文原文、论文解读、Github代码实现。 2017Transformer继MLP、CNN、RNN后的第四大类架构2018GPT使用 Transformer 解码器来做预训练2018BERTTransformer一统NLP的开始2019GPT-2更…

ChatGPT中的Token:了解聊天模型的基本单位

✍创作者:全栈弄潮儿 🏡 个人主页: 全栈弄潮儿的个人主页 🏙️ 个人社区,欢迎你的加入:全栈弄潮儿的个人社区 📙 专栏地址:AI大模型 ChatGPT中的Token是什么? 在ChatGPT…

本地搭建属于自己的ChatGPT:基于PyTorch+ChatGLM-6b+Streamlit+QDrant+DuckDuckGo

本地部署chatglm及缓解时效性问题的思路: 模型使用chatglm-6b 4bit,推理使用hugging face,前端应用使用streamlit或者gradio。 微调对显存要求较高,还没试验。可以结合LoRA进行微调。 缓解时效性问题:通过本地数据库…

log|nonebot——2|插件nonebot-plugin-chatgpt尝试,失败。

顺利走通,大概了解了nonebot和gocqhttp之后。 尝试先调通nonebot里的chatGPT插件。是有的。 尝试了这个,人最多,教程也写的清晰的GitHub - A-kirami/nonebot-plugin-chatgpt 按照readme教程走。直接核心直接bug 往下翻。 windows10 2023年…

chatgpt+安全机器人控制器+底盘一体化方案设计构想

“你有没有想过,你只需告诉你的家庭助理机器人:‘请加热我的午餐’,它就会自己找到微波炉。这是不是很神奇?” 近日,微软在其官网发表了一篇名为《机器人 ChatGPT:设计原则和模型能力(ChatGPT …

国外顶尖高校、企业分享人工智能自学课程英文原课程分享

人工智能无疑已经是当下最火热的方向,在很多领域已经融入我们生活,ChatGPT,Midjourney只是其中一个细分热点。目前这个领域,虽说国内也有不少课程,但是大部分源头还得从英文资料中找。如何学到最新最强得人工智能技能,…

面对chatGPT,冷静比鸡血更重要!

这段时间 chatGPT 也算是疯狂的吸引眼球了。 看起来广告费没白花,不管说的对不对,反正说它一定要用**“颠覆”“天花板”“惊艳”“抢大多数人的饭碗”**之类的词。 再大一点的描述就是:留给人类的时间不多了。扼腕叹息、杞人类生存空间而忧…

探索 20 年,依然难落地,是谁阻止了教授们的「学术休假」?

一曰经济问题,二曰学术焦虑,但归根结底还是保障制度缺失。 撰文:陈彬(中国科学报) 本文转载自:中国科学报,原标题《谁阻止了教授们的“学术休假”》 早在本世纪初,我国高校已开始“试…

AIGC时代,分享11款超实用AI生成内容检测工具

前往未来百科查看全部AI内容检测工具箱 一、AI 内容检测器 在数字内容创作的世界中,高质量的内容对至关重要。但随着创建的内容量不断增加,确保内容是原创的、高质量的非常具有挑战性。 AI 内容检测器指的是一种利用人工智能技术来自动化审核和识别不当…

国内C刊声明:隐瞒ChatGPT使用情况,将退稿或撤稿处理!

编辑:CVer公众号 | 来源:中国新闻网、澎湃新闻 国内情况 近期,《暨南学报(哲学社会科学版)》发布关于使用人工智能写作工具的说明。 说明提到,暂不接受任何大型语言模型工具(例如:Ch…

这个chatGpt的,挺有趣

转发:ChatGPT使用总结:150个ChatGPT提示词模板(完整版)_智能推荐系统的博客-CSDN博客 所有提示词模板功能列表如下: 💻 充当 Linux 终端 i want you to act as a linux terminal. I will type commands an…

ChatGPT 提示的艺术:制作清晰有效提示的指南(The Art of ChatGPT Prompting)

🥑 Welcome to Aedream同学 s blog! 🥑 文章目录 ChatGPT 提示的艺术:制作清晰有效提示的指南关于前言介绍什么是ChatGPT,它是如何工作的?那么,它与其他聊天机器人有何不同?ChatGPT可以用来做什…

ChatGPT 设计游戏剧情 | 基于 AI 5 天创建一个农场游戏,完结篇!

欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏。到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中。本文将向您展示如何将 AI 工具用于: 美术风格 游戏设计 3D 素材 2D …

【Python学习笔记】cs231nPython Numpy教程

【Python学习笔记】cs231nPython Numpy教程 回顾经典教程cs231n,完成assignments觉得很困难,感觉自己python基础语法掌握的不是很熟,就顺藤摸瓜找了cs231n他们的官方Python个Numpy教程 如果对英文原版上手有困难,可以看这个&…

在Eclipse中使用Junit测试代码

一、在项目中加入Junit库 右击项目文件,在选项中选择BuildPath这一选项。 选择Add Libbraries选项,在其中找到Junit,可以自行选择需要的Junit版本。 当你的项目中除了之前的基础库文件,还出现了Junit库,说明已经添加…

玩转 GPT4All

目录 什么是Chatgpt 什么是gpt4all 如何使用 第一步:下载LLM模型 第二步:下载代码 第三步:将模型替换到 第四步:执行启动命令 第五步:生成自己的客户端 第六步:启动 第七步:配置UI 什么…

Android Studio Gradle 无限 Build「假死」

Android Studio Gradle 无限 Build「假死」 解决方案 工程配置 Gradle 的 gradle.properties 文件中添加如下代码: org.gradle.daemontrue org.gradle.paralleltrue然后重新 Sync 工程,漫长等待依赖下载完成后,重新 Build 项目即可 补充 …

Python3.7出现RuntimeError: generator raised StopIteration异常

出现该异常有很多种情况: 我说下我遇到的情况 希望对你有帮助 当模型运行fit_generator会抛出generator raised StopIteration的异常,其实是因为generator没有获取到相应的数据 这里的G是LoadBatches1.imageSegmentationGenerator做的一个生成器 G …

【AI前沿】chatgpt还有哪些不足?

博客昵称:吴NDIR 个人座右铭:得之淡然,失之坦然 作者简介:喜欢轻音乐、象棋,爱好算法、刷题 其他推荐内容:计算机导论速记思维导图 其他内容推荐:五种排序算法 在这个愉快的周末让我们聊一下Cha…