ChatGPT检测器来了!支持中英双语

6db2ec7beb58645c373a1758ab561f4a.jpeg

编|郭必扬 

源|SimpleAI

那一夜...

  • 2022年11月30号,OpenAI推出了ChatGPT,给NLP届乃至各行各业的人带来了巨大的惊喜和惊吓[1];

  • 2022年12月5号,由于受到ChatGPT的冲击,Stack Overflow宣布禁止用户在平台上发布由ChatGPT生成的内容[2];

  • 2022年12月8号,我夜不能寐,作为一个普普通通NLP研究者,被ChatGPT冲击到自我怀疑,不断反问自己在ChatGPT时代还能做些什么研究。思来想去,我觉得在ChatGPT如此强大的情况下,我们非常需要一个ChatGPT检测器,来判断一段内容是否是ChatGPT生成的......

当晚我很晚才睡着,但是第二天一大早就醒了,兴冲冲得跟几个好友讨论了这个事儿,经过一番讨论,我们觉得这是个有价值的事儿,值得一做!接着我们在一个更大的群里(孤勇AI研究者群hhh),对这个话题展开了热烈讨论。当天晚上,我们便组建了一个由海内外6所高校或企业的博士生/工程师组成的8人团队,为了一个共同的目标:

“开发一套ChatGPT检测工具,同时收集第一手宝贵的人类-ChatGPT对比数据集,来助力相关学术研究。

这一天是2022年12月9日,是ChatGPT推出的第10天。我们一帮普普通通的国内AI孤勇者们,就这样踏上了一段充满未知和挑战的旅程。51d7ec9f39f88c6b2ac59b35a482b080.jpeg

在我们立项之后,也有有业界大佬提出类似的想法,例如一流科技创始人袁进辉12月11日提到“我觉得一个迫在眉睫的需要研究的问题是,怎么区分真实由人类生成的文本和chatGPT生成的文本?”32c679a6b110bec881e44db8fced4594.png

另外,12月21日,清华大学也开始招募志愿者来收集 ChatGPT 的中文数据;而在国外,根据最近的新闻,普林斯顿大学也有团队在做类似的事情,并于1月3日提出了一个demo (即最近很火的 GPTZero [3])。相比之下,我们可能是最早开始这方面研究的团队了,但是一直很低调而忙碌地在收集数据、分析、训练模型....(其实应该学习人家普林斯顿大学团队,不管东西做了多少,先放出一个Demo....哎,少不更事啊!)虽然风头被抢了,但我们团队一开始的初衷就不是蹭热度,而是为社区做出一些真正的贡献,ChatGPT检测器只是我们计划的一部分,我们计划:

  • 收集一批有价值的人类和 ChatGPT 对比中英双语问答语料,这对于我们研究人类和大型语言模型(LLM)很重要,可以帮助我们研究LLM的特点、跟人类的差距、未来LLM改进的方向;

  • 对大量的人机对比语料进行细致的分析,并进行多方面的人工评测,探究人类和ChatGPT分别具有什么有趣的潜在的模式。这些探索将有助于思考LLM未来应去往何方;

  • 最后,基于对比数据集以及语料分析,开发应对不同场景的一系列检测模型,这些模型可帮助普通用户和UGC平台来识别、监管 AIGC  (AI Generated Content)。

项目进展汇报

今天,距离我们立项,已经过去了大约一个月。一个月,我们的私有仓库进行了 166 次 commits,大家基本每天都在为之奋斗:641184f8bcead834586b0469a57371ac.png

今天,我们已经收集了中英文的 3-4 万个问题和近 10 万条「人类-ChatGPT 对比」回答语料,涵盖了开放域、计算机科学、金融、医疗、法律、心理等多个领域。这批语料集从各个领域,反映了人类专家和 ChatGPT 在面对同一个问题时会有怎么不同的回答;我们对这批对比语料进行了大量的特征分析,发现了很多有趣的结论,相关的人工测评也正在紧锣密鼓的进行,基于这个语料库和相关分析,我们开发了三种使用不同算法、针对不同场景的 ChatGPT 检测模型(都支持中文和英文,已经上线 🤗 Hugging Face Spaces):

  1. 问答版,输入问题和回答,使用预训练模型分类器判断回答内容是 ChatGPT 生成还是人类撰写。
    访问链接: https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-qa

  2. 单文本版,判断任意文本是 ChatGPT 生成还是人类撰写,技术与(1)相同。
    访问链接: https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-single

  3. 语言学特征版,基于一些计算语言学特征,使用机器学习建模进行检测。
    访问链接: https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-ling

873617af5f8ab86dc837696a5b7c351f.png

我们近期的计划如下:

EventsDates
Project Launch / 项目启动2022-12-09 ✅
Comparison Data Collection / 对比数据收集2022-12-11 to Now 🏃‍♀️
Release ChatGPT Detector (Demo) / 检测器 Demo 发布2023-01-11 ✅
Models Release / 模型开源Coming in a week 🛬
Comparison Corpus Release / 语料集开源Coming in a week 🛬
Research Paper / 研究论文发布Coming in a week 🛬
......

欢迎大家关注我们的项目主页:
https://github.com/Hello-SimpleAI/chatgpt-comparison-detection我们将于大约一周内开源代码、模型和语料集,希望得到大家的宝贵反馈!

ChatGPT 检测器展示:

下面,我们使用我们的检测器,对多个平台的内容以及ChatGPT相应的生成内容,进行检测,包括英文:

  • Wikipedia概念解释

  • Quora开放问答

中文:

  • 百度百科概念解释

  • 知乎开放问答

Wikipedia

GPT系列模型都在Wikipedia语料上进行了充分的训练,这导致GPT系列模型会生成跟WIkipedia风格十分类似的文本,因此Wikipedia语料十分考验检测器的能力,下面我们随机找一个概念,分别检测人类专家的解释和ChatGPT的解释:6fa7ecd95e386f702effc924b373c0fe.png

预测正确!(我们同时测了GPTZero,发现其预测错误。GPTZero主要使用文本困惑度以及句子间的困惑度变化来进行预测,一般人类的句子间困惑度差异会较大,而AI生成的内容则较小,而对于WIkipedia这种十分规范的文体,可能句子间的困惑度差异也较小,因此可能导致GPTZero判断错误)

Quora

fcff97615cc0d5ff20f4e820c6acf3a6.png

百度百科

de8022df25ce1958de2f541bdadb3e25.png

知乎

知乎上,我们选取了问题“如何评价OpenAI的超级对话模型ChatGPT”,并测试了周博磊老师的回答和ChatGPT自己的回答:87114030329a4015834ffbd15cc6d9ca.png

最后,希望大家关注我们Github项目:305b540c4f64f7c9daa492c0ccbed9c6.pngGithub:https://github.com/Hello-SimpleAI/chatgpt-comparison-detection
我们也邀请广大朋友一起来调戏我们的检测器,如果能为我们提供一下预测错误的Bad Cases,那就太感激了!🤗我们的开源代码模型语料集,将会和我们的研究论文一并在近期公布,届时再进一步跟朋友们进行交流。鉴于 OpenAI 的“不Open”,以及 AIGC 对当下学界的冲击和社会的潜在风险,我们希望能和更多志同道合的朋友,一起为开放的学术研究做贡献!❤️❤️
24932a34669ff526237ba6cedc1db784.png

a63669c3a6b128048b3771ee44de9781.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

 38f592efbe532eddcc09fb3630f383e6.png

[1]ChatGPT: https://openai.com/blog/chatgpt/

[2]Stack Overflow禁用 ChatGPT: https://meta.stackoverflow.com/questions/421831/temporary-policy-chatgpt-is-banned

[3]GPTZero: http://gptzero.me/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3628.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT专业应用:纯英文视频-中英文快速字幕添加

正文共 900字,阅读大约需要 3 分钟 视频翻译、内容制作人群必备技巧,您将在3分钟后获得以下超能力: 1.无需英文基础,纯英文视频翻译 2.中英文转译 Beezy评级 :A级 *经过寻找和一段时间的学习, 一部分人能…

全网最详细中英文ChatGPT-API文档(一)开始使用ChatGPT——导言

开始使用ChatGPT导言 Introduction 导言Overview 概述Key concepts 关键概念Prompts and completions 提示和完成Tokens 标记/符号Models 模型Next steps 下一步步骤 其它资料下载 Introduction 导言 Overview 概述 The OpenAI API can be applied to virtually any task tha…

一场关于ChatGPT话语权的深度思考:人类会在大模型中迷失自我吗?

大数据文摘授权转载自AI科技评论 作者:Elizabeth Weil 译者:ChatGPT 编辑:孙溥茜 ChatGPT 之风愈演愈烈,华盛顿大学语言学家 Emily M. Bender 公开反对让大模型(LLM)过度介入人们的生活。 谷歌和亚马逊在论…

当ChatGPT遇上弱智吧…

点击上方“AI遇见机器学习”,选择“星标”公众号 重磅干货,第一时间送 来自:量子位 没想到,无敌如弱智吧,也有被ChatGPT“反将一军”的时候。 提问AI“咱们来玩个马吃草的扮演游戏吧,我草你马。” AI咀嚼了…

操作ChatGPT竟写出毁灭人类计划书!“AI正在指数级发展”

Datawhale干货 技术:ChatGPT,来源:量子位 “网红AI”ChatGPT,又被玩出了新花样! 这次,在一位工程师的诱导下,ChatGPT竟写出了毁灭人类的计划书。 步骤详细到入侵各国计算机系统、控制武器、破坏…

如何用 ChatGPT 帮你自动分析数据?

前段时间,我在 ChatGPT 选单里看到了 Code Interpreter。但是它正在灰度测试中 —— 先给一部分用户试用,如果反响不错并做了一定改进,就能推广给更多用户。 可惜当时我没能正确理解它的含义,我以为 Code Interpreter 是指「代码解…

【ChatGPT】ChatGPT生成软件架构和代码,20年架构师惊呆了!

最近几周,OpenAI对ChatGPT产生了很多兴趣,出现了各种有趣的用例。 在许多方面,这是与架构师白板相当的AI,但它有很多用途,而不仅仅是绘制线条和方框。在这篇文章中,我想使用这项创新技术来演示启动软件架构…

ChatGPT+Word的智能化文字生成和应用

在Word中引入OpenAI代码需要使用VBA编辑器。以下是在Word中引入OpenAI代码的步骤: 打开Word文档,按下Alt F11键打开VBA编辑器。 在VBA编辑器中,选择“插入”菜单,然后选择“模块”。 在新建的模块中,将OpenAI代码粘…

李宏毅chatgpt,生成式ai

ChatGPT原理剖析 李宏毅_哔哩哔哩_bilibiliChatGPT原理剖析 李宏毅共计18条视频,包括:1/3 对 ChatGPT 的常见误解、2/3 预训练 Pretrain、3/3 ChatGPT 所带来的研究问题等,UP主更多精彩视频,请关注UP账号。https://www.bilibili.c…

亲测有效,如何用ChatGPT 生成高质量原创视频

尽管ChatGPT目前缺乏视频生成的能力,但我们可以借助插件实现视频生成,特别是对于那些从事Tiktok海外运营的用户而言,Visla和HeyGen是我目前测试的两款可生成视频的插件。 首先登陆您的ChatGPT帐号,并单击邮箱,勾选设置…

「ChatGPT」爆火背后的大语言模型到底是什么?

点击上方关注 “终端研发部” 设为“星标”,和你一起掌握更多数据库知识 本文首发于我的知乎,终端研发部! 链接:https://www.zhihu.com/question/585248111/answer/2903130554 说起chatGPT,我们都知道非常的火爆&#…

ChatGPT 还没达到“基础模型”状态,国产大模型“速胜论”不靠谱!

整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 在经历寒冬、雾霾,甚至大家纷纷看不到希望之际,ChatGPT 犹如一场春雨,给做 AI 甚至 NLP 等研究的人带来了新的希望。 3 月 11 日,由中国人工智能…

ChatGLM-6B 类似ChatGPT功能型对话大模型 部署实践

好难为了看到这个页面 ChatGLM-6B 简介 ChatGLM-6B 是基于清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同训练的语言模型开发的一个开源的类 ChatGPT 模型, ChatGLM(alpha内测版:QAGLM)是一个初具问答和对话功能的中英双语模型&#xff0c…

【ChatGPT】各大互联网企业开发的类ChatGPT大模型

各大互联网企业开发的类ChatGPT大模型 国际互联网公司国内互联网公司 ChatGPT是由开放人工智能公司OpenAI开发的一款基于人工智能技术的聊天机器人,采用了大规模Transformer网络,可以实现对话的生成和理解。其可以进行多轮对话,并具备一定的语…

技术科普与解读:ChatGPT 大模型硬核解读!(三)GPT-4的多模态架构

本文选自《GPT-4核心技术分析报告》的第2章的简写版(无公式版)。前两节从GPT家族的发展历史开始,讲解GPT-4的多模态架构和GPT-4中的关键技术。 作者陈巍博士为AI/存算一体专家,曾担任华为系自然语言处理企业的首席科学家。 技术科…

从ChatGPT出发:大模型与自然语言模型

目录 引言基石故事的开始:Transformer异姓兄弟:GPT、Bert与GPT-2GPTBertGPT-2 大力出奇迹:GPT3模型的进化:InstructGPT ChatGPT代码库TransformerGPT-2GPT-3InstructGPT 未来的工作安全性&有效性算力与标注代价的平衡 参考文献…

ChatGPT的各项超能力从哪儿来?万字拆解追溯技术路线图来了

作者:符****尧、彭昊、Tushar Khot、郭志江等**** 符尧(yao.fued.ac.uk),爱丁堡大学 (University of Edinburgh) 博士生,本科毕业于北京大学。他与彭昊、Tushar Khot在艾伦人工智能研究院 (Allen Institute for AI) 共…

ChatGPT从入门到精通学习路线

课程名称适应人群 ChatGPT从入门到精通,一站式掌握办公自动化/爬虫/数据分析和可视 点击上述名称,学习完整视频 全面AI时代就在转角,道路已经铺好了“局外人”or“先行者”就在此刻等你决定 1、对ChatGPT感兴趣并希望有人手把手教学的新手 …

ChatGPT常用的指令(prompts)系列九——生活教练、评论员、魔术师

系列文章目录 内容翻译自:https://github.com/f/awesome-chatgpt-prompts,并加入自己的实践内容 1、 ChatGPT常用的提示语(prompts)系列一 2、 ChatGPT常用的提示语(prompts)系列二 3、 ChatGPT常用的提示语…

ChatGPT黑化版来了!拉踩TikTok用户智商、写暴力故事等为所欲为,bug只因3个字母...

杨净 羿阁 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT“越狱”后,彻底放飞自我了。 直接无视掉OpenAI给它在安全、伦理上限定的条条框框—— 写暴力故事、拉踩用户智商、随意预测未来……简直无恶不作! 而这一切背后竟然只靠一位Reddit用户实现&#xf…