他做了一个「ChatGPT 杀手」,a16z 抢着投

290f55d4926662cdd02fe4c2c92c10dd.gif

比「GPT 侦探」更重要的是,AI 生成内容在不同行业的「容忍度」。

c1bf3d287b7787dc137c6020dbb9620a.png图片来源:由无界版图AI工具生成

作者 | 美漪
编辑 | 靖宇

最近两个月,科技圈最热的话题,无疑是 OpenAI 推出的对话式 AI 应用 ChatGPT,不仅可以让它给你写一首诗、回答你的任何问题,甚至可以让它帮忙写没那么复杂的代码。业内甚至认为,ChatGPT 甚至有取代谷歌的潜力。

为 ChatGPT 欢呼的还有另一群人,就是「社畜」和学生——他们发现月度总结、学校论文和作业这样的任务,也可以让 ChatGPT 代劳了,后者甚至写得有模有样,不比真人写得差多少。

ChatGPT 似乎让学生们的日子更轻松了,但却让教师更「头疼」了,因为后者很难确认,眼前这些文字,到底是学生写的,还是出自 OpenAI 的产品之手。为此,纽约教育部甚至禁止公立学校使用 ChatGPT。

在这样的混乱中,一位普林斯顿大学的学生,Edward Tian 推出了一个专杀 ChatGPT 的应用——「GPTZero」,有了这面「照妖镜」,内容是人写的,还是机器写的,真相马上就揭晓。

「GPTZero」在网络迅速爆红,吸引了 a16z 在内的硅谷创投的目光。但是应用创造者本人 Tian 却认为,最重要的事,是「让 AI 更加透明」。

01

「ChatGPT 杀手」

在 ChatGPT 成为学生们「偷懒」的神器后,教育和科研机构不得不开始抵制这个新的噩梦。

纽约教育部宣布禁止学生在公立学校使用 ChatGPT ;全球知名机器学习会议之一的 ICML 也宣布禁止发表包含由 ChatGPT 和其他类似系统生成内容的论文,以免出现「意外后果」。

出于对学术界,使用 ChatGPT 相关道德问题的担忧,华人小哥 Edward Tian 在一家当地的咖啡店里,花了一个寒假的时间,研发了 GPTZero,希望能让学术界恢复严谨性。

Tian 年仅 22 岁,目前仍是美国普林斯顿大学的大四学生,主修计算机科学专业,专门研究自然语言处理,同时辅修认知科学和新闻学。

2260e625e7d38d0cf8b11bb9f724c5ec.png

GPTZero 的开发者 Edward Tian|网络

他还曾是英国广播公司和开源情报网站 Bellingcat 的研究员,也曾是被微软收购的反恐初创公司 Miburo Solutions 的分析师。在那里,他监测虚假信息和机器人检测。Tian 说,「所有的这些经历,都是他研发 GPTZero 的动力」。

2023 年 1 月 2 日,Tian 将 GPTZero 发布到网络,预计只会有几十个人尝试它,完全没有想过,这会掀起一场世界级别的轩然大波。

在他把这款软件上传到互联网上的几个小时内,竟有超过 2000 人在 Steamlit 上测试了 GPTZero 的公开版本。

1 月 5 日,也就是发布的第三天,Tian 对 GPTZero 做出了更新和改善,还显著降低了误报率;此时,新程序已有超过 1 万的用户量了!Tian 也不禁对它的「爆炸性增长」和「病毒式传播」感到震惊。

据 NPR 报道,一周内有 3 万多人试用了 GPTZero,甚至「导致该应用由于出乎意料的高网络流量」而崩溃,托管 GPTZero 的免费平台 Streamlit 此后介入,以更多的内存和资源支持 Tian,以处理网络流量。

Edward Tian 通过在视频中展示其对一篇《纽约客》文章和 LinkedIn 上的 ChatGPT 生成器的帖子的分析,展示了该应用如何区分人类和人工智能撰写的文本。

GPT Zero 的工作原理就是检测文本的「困惑性」(Perplexity)和「突发性」(Burstiness)这两项指标,并分别对其打分,根据统计学特征来确定,文本是由人工智能写的还是人类写的。总体来说,如果这两项参数得分都很低,那么该文本很有可能出自 AI 之手。

这里所说的「困惑性」,是指来自人类所写作品的语言的复杂性和随机性。

这个指标主要是衡量文本在一个句子中的随机程度,以及一个句子的构造方式是否会让 GPTZero 感到困惑。

每当用户在 GPTZero 输入一段测试内容,它就会分别计算出:「文字总困惑度」、「所有句子的平均困惑度」、「每个句子的困惑度」。

这些数值越低,越能说明这个文本对 GPTZero 来说是非常「熟悉」的,那么它很可能是 AI 生成的;相反,如果这些数值越高,就越能说明文本中句子的构造或用词方式让 GPTZero 感到「惊讶」,那么它就更可能是出自人类之手。

这是因为,人工智能接受过数据库的训练,生成的文本在一段时间内,表现出的困惑度会更均匀和恒定,选词的可预测性也更高;而人类书写的文本则不会这样,真人的遣词造句一般会比较随机,比机器更容易写比较出乎意料的词句。

3748885e676193039db12a2e303c2521.jpeg

使用 GPTZero 检测文字是否由 ChatGPT 生成|Twitter

而「突发性」,则是指来自人类使用的句子结构的变化。

这个参数主要是比较句子复杂性的变化程度,衡量它们的一致性。

这是因为,人类倾向于写高度复杂的文本;而人工智能产出的文本则是低复杂度的;此外,由于人类的思维结构不是线性的,他们的句子结构也遵循类似的模式。

这意味着,人类使用句子结构,会在长而复杂的句子,和短而简单的句子之间摇摆不定,有着更多的句式变化,比如复杂和简单交替并存,一个长难句之后接着出现更简短的句子;而机器生成的句子则倾向于更加统一,很少会有一系列长度相差很大的句子。

简而言之,在选词上「简单」而「熟悉」,并使用「统一整齐」的句子,是人工智能生成作品的标志特征,而更复杂和多样的东西,则表明是人类写的。这也是「困惑性」和「突发性」这两项指标可以作为衡量标准的原因。

除了 Edward Tian 本人对 GPTZero 进行测试之外,也有不少网友用它对 ChatGPT、一些 GPT-3 衍生工具生成的内容进行了多次测试。最终结果显示,GPTZero 每次都能抓住 AI 生成的文本,并在十多个案例中正确识别了人类写的文本。

GPTZero 的一炮而红,让 Tian 获得了来自 a16z、 Menlo Ventures 和 Red Swan 等知名风投的青睐。不过,面对推特私信和电话轰炸,Tian 却显得异常冷静,他谦逊地表示自己不会拒接投资者打来的电话,但他不会忘记自己仍然是一位即将毕业的大四学生。

同时,他还表示自己的 GPTZero 尚未完成,仍需改进和进一步地开发,甚至计划让大家继续免费使用他的程序,用来支持各地新晋英文老师的工作。

02

急需的「AI 透明」

对于 GPTZero 这一甄别文字是否是 AI 写作的新程序,推特上的舆论褒贬不一,以教师为代表的成年人大多喜闻乐见,而学生却讽刺 GPTZero 的创造者 Tian 是「学术缉毒警察」。

的确,当 GPTZero 推出时,Tian 收到了众多教师对该应用程序在检测 AI 写的文章方面的积极反馈,来自世界各地的无数教师也都对 Tian 表达了他们的感激之情——这让他们的教学难度大大减轻了。

当然,也不难理解,不少学生并不看好 Tian 这款打击学术偷工减料、不劳而获的软件。

事实上,不只是 Tian,就连 ChatGPT 的开发商 OpenAI 自己,也已经表明了对防止人工智能剽窃的承诺。

2022 年 12 月,OpenAI 专注于人工智能安全的研究员 Scott Aaronson 透露,该公司正在努力开发「缓解措施」,用一种「不易察觉的秘密信号」对 GPT 生成的文本打上「水印」,以识别其来源,从而打击作弊的系统。

这项技术将通过微妙地调整 ChatGPT 选择的特定单词选择来发挥作用,读者不会注意到这种方式,但对于任何寻找机器生成文本迹象的人来说,这在统计上都是可预测的。

公司发言人表示,「我们将 ChatGPT 作为新研究的预览技术,希望能从现实世界的应用中进行学习。我们认为这是开发和部署功能强大、安全的 AI 系统的关键部分。我们会不断吸取反馈和经验教训,」。

936d6654262936269f0601fed9edbed7.png

GPTZero 首页|GPTZero

此外,OpenAI 还联合哈佛等高校机构联合打造了一款检测器:GPT-2 Output Detector

作者们先是发布了一个「GPT-2 生成内容」和 WebText 数据集,帮助 AI 理解机器语言和人类语言之间的差异。

随后,用这个数据集对 RoBERTa 模型进行微调,就得到了这个 AI 检测器。其中人类语言一律被识别为 True,AI 生成的内容则一律被识别为 Fake。

值得一提的是,RoBERTa 是 BERT 的改进版。原始的 BERT 使用了 13GB 大小的数据集,但 RoBERTa 使用了包含 6300 万条英文新闻的 160GB 数据集。

尽管如此,还是有不少人认为,「AI 文本检测器」注定是一场失败的「军备竞赛」,其实际效果并不理想,更无法阻挡 ChatGPT 等 AI 语言模型的发展。

然而,尽管 Tian 建立了 GPTZero,他并不反对使用 ChatGPT 等人工智能工具,他认为 GPTZero 应用程序的目的不是阻止这些新技术的使用,而是提供一种负责任地使用这些技术的方法,并提供必要的保护。

同时,相对于对抗或者禁止一项技术,也许更重要的是如何为其使用定下规范和标准。例如,在广告、影视及娱乐等行业,对于 AI 生成类内容的容忍度可能适当提高一些;而在学术、教育和科研领域,非常强调准确性和原创性,毫无疑问,对于 AI 生成内容的容忍度就要低一些。

而如何确定 AI 工具使用的「透明度」,可能要比研究如何「反 AI」,要更有效,也更有意义一些。

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

bfb895da0a74105c151114e25c180d7b.gif

中文推特:https://twitter.com/8BTC_OFFICIAL

英文推特:https://twitter.com/btcinchina

Discord社区:https://discord.gg/defidao

电报频道:https://t.me/Mute_8btc

电报社区:https://t.me/news_8btc

44ba25ea8275a3ee284eb013864c6640.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15066.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

巴比特 | 元宇宙每日必读:ChatGPT「代码解释器」正式解禁,它补齐了ChatGPT的哪些短板?用户该如何使用?...

摘要:7月9日,OpenAI 的聊天机器人 ChatGPT 推出了新功能:代码解释器(Code Interpreter)。这个新功能已经对所有 Plus 订阅用户开放,其扩展了 ChatGPT 的功能,为用户带来了更好的交互式编程体验和…

ChatGPT应用组队学习来了!

Datawhale学习 联合主办:Datawhale、百度文心 Datawhale联合百度文心,五月为大家带来AIGC应用专题:大模型从入门到应用,学习大纲如下(文末整理了这次学习的所有资料): 参与学习 ▶ 活动时间&am…

阿尔法狗咬向ChatGPT七寸

图片来源:由无界AI生成 瞄准ChatGPT,谷歌的下一枚炮弹已经准备好,只待发射。而担负起发射任务的,是谷歌DeepMind。 昨天,谷歌DeepMind的CEO德米斯哈萨比斯(Demis Hassabis)在采访中放出豪言&…

谷歌版ChatGPT突然公测!上手实测结果在此,体验申请通过飞快

杨净 金磊 发自 凹非寺量子位 | 公众号 QbitAI 谷歌吃了大亏之后,这次一声不吭,放了大招: 对标ChatGPT的Bard测试版,刚刚正式对外发布。 而且这次用户在申请候补名单之后,无需经历漫长的等待时间。 没错,量…

对抗 ChatGPT 的创业武器:专注和紧密的反馈循环

ChatGPT 超越谷歌主导地位 在我的上一篇文章中,我探讨了 ChatGPT 超越谷歌主导地位的可能牛市案例。但我也对我认为是熊市的情况表示赞赏。正如我提到的,ChatGPT 的无界界面有点像,而不是 DoorDash 的重点推出策略,DoorDash 在美国所有城市和商品类别中同时推出,当你订购…

chatgpt赋能Python-python_queque

Python Queue模块实现队列的介绍 Python语言是一种通俗易懂、功能丰富的编程语言。它的标准库还包括许多有用的模块,用于实现各种数据结构和算法。其中,Queue模块是一种实现队列的模块。这个模块实现了多线程编程时所必需的队列数据结构。 什么是队列&…

ChatGPT已能操控机器人,工程师连代码都不用写,网友:微软在搞天网?

Alex 发自 凹非寺量子位 | 公众号 QbitAI 当我还在跟ChatGPT吹牛尬聊时,有人已经在拿它操控机器人了。 不是别人,正是OpenAI的金主爸爸、不久前刚拿ChatGPT“重新发明搜索引擎”的微软。 到目前为止,开发者调教机器人不仅技术门槛高&#xff…

火爆外网的ChatGPT,改Bug,敲代码不在话下

目录 前言 一、ChatGPT 是什么? 二、ChatGPT到底有什么用 1.可以回答问题 2.帮你创作文章和标题 3.调试代码和修复代码 4.检测安全漏洞,也许还能创建PoC 总结 前言 这几天ChatGPT AI 可谓是火的一塌糊涂,那么它到底是什么&#xff1f…

Python使用itchat库+图灵机器人(新手上路)

前不久有个朋友说,谁谁的男朋友写个机器人,然后聊天很嗨的样子,看下面图,然后今天下午闲着,就把整理了下思路,采用Python进行如下开发,具体步骤如下: 1、第一步,因为我是…

图灵 | 计算机器与智能

【“计算机器与智能”选自《Mind》,no.2236(1950.10),P433-460。牛津大学出版社允许重印。刘西瑞、王汉琦 翻译】 1. 模仿游戏 我建议来考虑这个问题 :“机器能够思维吗?” 这可以从定义 “机 器” 和 “思…

图灵奖得主LeCun评ChatGPT不算创新,被网友骂柠檬精

“ChatGPT并不算创新。” “OpenAI做的这个东西跟其他实验室相比,根本算不上什么进步。” 这两天,图灵奖得主LeCun公开和大热趋势“唱反调”,瞬间引发网友围观。 要知道,ChatGPT功能强大又好玩,火爆全网,任…

本地化部署大语言模型 ChatGLM

本地化部署大语言模型 ChatGLM 本地化部署大语言模型 ChatGLM前期筹备GitHub 基础包语言模型文件基础配置显存查看方法 Anaconda 模块ChatGLM-6B 网页部署Anaconda 环境创建根目录操作基础依赖加载transformers 和 protobuf 库加载Pytorch 源修改依赖库补充补充依赖 pypi 配置c…

麻将AI 不完全信息博弈学习笔记(完结)

前言 在这学期的数据结构必修课中,老师向我们提供了两道题: 其一是六子棋问题; 其二是麻将AI问题; 前者是经典的完全信息博弈问题,根据我已有的知识,利用博弈树和合理的剪枝可以提供一种高效的解法&#x…

数据库入门教程--01建库建表插入数据以及数据的修改

if exists(select * from sysdatabases where name Datatest) Drop database Datatest go--判断是否已存在数据库Datatest,并删除 create database Datatest--创建数据库 on--创建数据文件 (nameDatatest,--数据库中文件名filenameD:\数据库练习文件夹\Datatest.mdf…

医疗版ChatGPT直播评测!治疗方案与真人医生96%一致

杨净 发自 凹非寺量子位 | 公众号 QbitAI 国内首个医疗大模型,已经在“接诊”患者了。 最近,一组AI医生医院真实站岗数据曝光: 共接诊120多名患者,从问诊、检查到诊疗方案全流程覆盖;涉及心内科、消化内科、呼吸内科、…

利用ChatGPT思维分析硬科技创新趋势

2015年初夏,我去参加了在北京举办的联想科技大会。在会上,联想、英特尔、微软三位CEO第一次并肩上台发言,他们的演讲中都透露出对移动互联网行业的苦恼和无奈。尤其是微软的新CEO萨提亚纳德拉(Satya Nadella)&#xff…

微软为ChatGPT打造专用超算!砸下几亿美元,上万张英伟达A100打造

萧箫 发自 凹非寺量子位 | 公众号 QbitAI 微软砸下大几亿美元,专门为训练ChatGPT打造了一台超算—— 上万张英伟达A100芯片打造,甚至专门为此调整了服务器架构,只为给ChatGPT和新必应AI提供更好的算力。 △图源:微软 不仅如此&…

一次只要0.003美元,比人类便宜20倍!ChatGPT让数据标注者危矣

作者丨好困 来源丨学术头条 编辑丨新智元 点击进入—>3D视觉工坊学习交流群 【导读】最近,来自苏黎世大学的研究团队发现,ChatGPT在多个NLP标注任务上胜过众包工作者,具有较高一致性,且每次标注成本仅约0.003美元,比…

第2章信息技术发展

信息技术是在信息科学的基本原理和方法下,获取信息、处理信息、传输信息和使用信息的应用技术总称。从信息技术的发展过程来看,信息技术在传感器技术、通信技术和计算机技术的基础上,融合创新和持续发展,孕育和产生了物联网、云计…

ES+Redis+MySQL,这个高可用架构设计太顶了!

大家好,我是宝哥! 背景 会员系统是一种基础系统,跟公司所有业务线的下单主流程密切相关。如果会员系统出故障,会导致用户无法下单,影响范围是全公司所有业务线。所以,会员系统必须保证高性能、高可用&#…