ChatGPT标注数据比人类便宜20倍,80%任务上占优势 | 苏黎世大学

Pine 发自 凹非寺
量子位 | 公众号 QbitAI

又一“人类饭碗”被AI抢走,还是和训练AI息息相关的:

数据标注。

苏黎世大学研究发现,在ChatGPT面前,无论成本还是效率,人类可以说是毫无优势:

  • 成本上,ChatGPT平均每个标注成本低于0.003美元,比众包平台便宜20倍;

  • 效率上,在相关性、立场、主题等任务中,ChatGPT也是以4:1的优势“碾压”人类。

8540928eff84b281b06ecda53f7e1eef.png

论文发出后,有网友调侃,“生成训练数据需要人工”的说法已经成为过去式了。

2c410f513c159add649392c4c7283571.png

还有人直呼“古籍修复数字化工作是不是有希望提速了”。

7c7742c486143ec042edb78aa56951a5.png

还有人看热闹不嫌事大,直接发推称:

这是直接端了平台工作者的饭碗。

b0a70dcec0d843f7c7d40e064cabba19.png

话说回来,ChatGPT是怎么抢了数据标注工作者的“饭碗”的?

ChatGPT在80%任务上占优势

首先得先了解下数据标注工作的具体内容。

简单来讲,数据标注就是给社交媒体上的内容数据贴标签,将其以不同主题或者概念进行分类,或是对其立场以及情绪进行判别。

这些经过标注的数据就可以用作NLP模型的训练集或是评估标准。

以往,这类工作都是交由人工处理的,比如说MTurk就是专门进行数据标注的一个众包平台。

在MTurk这类众包平台内部,还会有更加精细的分工,比如说会有经过专业训练的数据标注者以及众包工作者。

前者在产出高质量数据上具有优势,但自然成本也更高,而后者虽然更便宜但质量也会随任务难度波动。

于是研究团队就开始着手研究大语言模型(LLM)在这方面的潜力,并且对比了没有额外训练(zero-shot)的ChatGPT(基于GPT-3.5)和MTurk在数据标注上的性能。

这项对比基于研究团队此前收集到的2382条推文样本。

ChatGPT和MTurk分别将推文以“相关性、立场、主题、政策、实用性”这五种任务进行标注。

评估的标准有两条:

  • 准确性:ChatGPT和MTurk众包工作者相较于正确标注的百分比;

  • 编码者间的一致性信度:用ChatGPT、MTurk众包工作者以及专业数据标注者任意二者之间的一致性来计算;

结果呢也显而易见,在准确性上,ChatGPT有五分之四的任务都要优于MTurk众包工作者。

一致性信度上,ChatGPT全部任务都超过了专业数据标注者。

ce5df3cc81ff5629bc380e05c40b09c4.png

成本方面,开头也已经提过,ChatGPT平均每条比人工便宜20倍,何况AI还能24*7无休。

1374e29fa2169357e90275db5ae50aec.png

不过对于研究团队得出的这个结论并不是所有网友都买账,有人表示:

这五条任务都太单一了,难度也是。仅凭这一点就得出这样的结论可靠性存疑。

80cfe0db34fa7812ce55d65e88b462ae.png

甚至还有网友嘲讽了起研究样本太少来:

(竟然)只用2382条推文做样本。

156a21029f31da64bb60ebe008aedda4.png

“饭碗威胁”不止数据标注

现在,AI会不会完全取代某一类工作还不好说,但它会在一定程度上影响人类工作是毋庸置疑的。

上周,OpenAI就发布过一份分析报告,称有80%的工作都会在一定程度上受到ChatGPT的影响,19%的岗位会受到ChatGPT的严重冲击。

并且薪资越高的职业受到的冲击就越大。

OpenAI还进一步列出了会被影响的具体职业,从大到小依次是:

翻译从业者、文字创作者(包括诗人、作家等)、公关人员、数学家、税务编制人员、区块链工程师、财务工作者、媒体从业者……

00c4d843c93569064b8af6800669a10f.png
图源:OpenAI

除此之外,OpenAI的CEO奥特曼也不止在一个场合下说过“AI会取代现有的部分工作”。

前不久,MidjourneyV5大升级也是让不少人类画师直呼饭碗不保。

b981a39b5e5508085b11247d848dcf4e.png

emmmmmm,你觉得你的饭碗还保得住吗?

论文地址:
https://arxiv.org/abs/2303.15056
参考链接:
https://twitter.com/arankomatsuzaki/status/1640521970608402435

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15711.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT引爆变革:第五个被颠覆的行业——市场营销与广告

随着人工智能技术的不断发展,ChatGPT已经开始在市场营销与广告领域产生深远影响。作为一款强大的文本生成工具,ChatGPT不仅能够撰写各类文章,还可以用于广告文案创作、营销策略设计以及消费者行为分析。 在广告文案创作方面,ChatG…

GPT-5根本不存在!ChatGPT之父Sam Altman首次公开表态,最新视频流出

新智元报道 编辑:编辑部 【新智元导读】4月13日,OpenAI CEO、GPT-4老板Sam Altman在接受视频采访时的一句话,让在场所有人惊呆了:「压根就没有GPT-5」! Sam Altman辟谣了!根本就没有GPT-5! 之…

LLM 系列 | 06:ChatGPT Prompt实践:文本摘要推断转换

简介 梅子留酸软齿牙,芭蕉分绿与窗纱。日长睡起无情思,闲看儿童捉柳花。小伙伴们好,我是微信公众号《小窗幽记机器学习》的小编:卖雪糕的小女孩。更多、更新文章欢迎关注 微信公众号:小窗幽记机器学习。后续会持续整理…

分布式session解决方案

一、Session工作原理: 三个问题: 1、Tomcat中的Session保存在哪? Tomcat本地的ConcurrentHashMap中(本地缓存),以sessionid为key。 2、Tomcat是怎么追踪到请求是属于哪个Session? 通过cook…

类ChatGPT编程秀-编写爬虫代码

随着ChatGPT的大火,越来越多的人习惯于用ChatGPT搞一些有趣的事。去年小编做了一个“有书乐享”的小程序,其中有部分的书籍信息是通过爬虫来抓取的数据,有书乐享”小程序可以看文章《一款简约的乐享书籍小程序》,现在主要是用Clau…

从运维的意义谈起

上周五在北京,原本约了优诺的傲寒想找他去聊聊,然后再回家,因为临时有事未能前往。每次和傲寒聊聊都会有很多收获,这回没能见面聊一聊,觉得有些遗憾。不过在机场的时候看到了天旦的CEO Vader的《运维的意义》&#xff…

OpenAI开放ChatGPT API:2分钱700字

我是卢松松,点点上面的头像,欢迎关注我哦! 昨天 ( 3 月1号)刚出的新闻,OpenAI宣布开放API了,定价为 0.002 美元/750 字,约合人民币2分钱700字。 OpenAI 现宣布,它现在允许第三方开发者通过 API…

一文通透优化算法:从梯度下降、SGD到牛顿法、共轭梯度(23修订版)

23年版前言 本文最初发布于2018年,然因今23年年初在写ChatGPT笔记故而研究RL,研究RL又开始系统重修微积分、概率统计,然后就注意到了此文,仔细审视本文之前18年的版本之后,发现写的和网上不少千篇一律的同类优化文章没…

0门槛克隆ChatGPT!30分钟训完,60亿参数性能堪比GPT-3.5

【新智元导读】破解「CloseAI」,ChatGPT克隆羊问世!0门槛实现「自研」,从此大语言模型不再只是少数大公司的「金手指」。 此前,OpenAI不Open的事件,已经引发了坊间的诸多争议。 光放出基准和测试结果,不提…

手把手教你使用React和OpenAI API构建和部署ChatGPT克隆应用程序

随着聊天机器人和虚拟助手的使用不断增加,许多企业和开发人员正在寻找创建自己的人工智能驱动的聊天机器人的方法。ChatGPT就是这样一个聊天机器人,它由OpenAI创建,能够进行类似人类的对话,并回答各种问题。 要建造什么&#xff…

开箱即用,完整版 ChatGPT 克隆方案,开源了!

在过去的短短几个月,以 ChatGPT、GPT4 为代表的 AI 应用和大模型火爆全球,被视为开启了新的科技工业革命和 AGI (通用人工智能)的新起点。 不仅科技巨头间你追我赶,争相推出新品,许多学术界、工业界的 AI 大…

元宇宙地产暴跌,林俊杰亏麻了

文/章鱼哥 出品/陀螺财经 随着元宇宙的兴起,元宇宙地产曾一度被寄予厚望,成为各大投资者追捧的对象。然而,最近的一次元宇宙地产价值暴跌再次提醒我们,高收益背后可能伴随着高风险。根据元宇宙分析平台WeMeta的数据显示&#xff0…

挤出泡沫、脱虚向实,AI大模型正在回归价值投资?

商品推荐、交通管理、生成文章、代码编程、电影特效制作……自ChatGPT横空出世以来,AIGC浪潮席卷全球,上下游产业链也因此大放异彩。 市场行情的高景气直观反映在股价上,无论AI公司是否盈利,其股价多呈上升趋势。一些与AI概念有所…

一路对标顶级产品,奇遇XR为何仍不见起色?

临近6月,再度遇冷的XR行业,又让很多人充满期待。外界普遍认为,基于苹果酝酿多年的MR头显产品,将于6月举行的WWDC 2023全球开发者大会正式亮相,XR行业或将迎来“iPhone时刻”。 在一派期待中,一家国内XR企业…

xAI迎战OpenAI|没有什么能够阻挡马斯克的AI梦想

出品|网易科技《智见焦点》 作者|赵芙瑶 编辑|丁广胜 马斯克的“X”系列又添新成员了。 对“X”有执念的马斯克,前不久刚刚将推特“注册名称”改为X Corp.,今天又在推特宣布成立新公司“xAI”。公司团队由马斯克领导&a…

上天了!但炸了:马斯克的「星舰」离火星又近了一步

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未来 来自:机器之心 成功发射,但在空中爆炸了。 这一刻,我们都仰望星空。 北京时间 4 月 20 日晚 9 点半,随着倒计时声音的结束,在 SpaceX 位于得州…

AI“应用商店”来了。OpenAI首批70个ChatGPT Plugin最全梳理

OpenAI放出大招,本周将向所有ChatGPT Plus用户开放联网功能和众多插件,允许ChatGPT访问互联网并使用70个第三方插件。 根据华尔街见闻的梳理,本批第三方插件能够全方位覆盖衣食住行、社交、工作以及学习等日常所需,基本上能够扮演…

手把手教你用 ChatGPT plugin 打造一个人知识库系统(一)

为什么需要个人知识库? 大概有很多人跟我一样,被现在信息过载弄得非常焦虑。很自然想到通过整理的方式来对抗信息过载,试图使用各种知识管理工具来整理这些信息,但最后折腾完各种工具后,才发现根本用不起来。因为这些…