比人类便宜20倍,ChatGPT让数据标注者危矣?

71d6a5d3d2e855e611172d7d199c083d.png

来源:学术头条 大数据文摘
本文约1000字,建议阅读5分钟
能否让机器帮助人类完成这一基础任务呢?

df27eef18e70bbd671394aceb6b03c49.png

当前,很多自然语言处理(NLP)应用需要高质量的标注数据来支撑,特别是当这些数据被用于训练分类器或评估无监督模型的性能等任务中。

例如,人工智能研究人员通常希望过滤嘈杂的社交媒体数据的相关性,将文本分配到不同的主题或概念类别,或衡量其情绪或立场。

而且,无论这些任务使用什么具体方法(监督、半监督或无监督),都需要标注好的数据来建立一个训练集或黄金标准。

然而,在大多数情况下,要完成高质量的数据标注(data annotation)工作,依然离不开数据标注平台上的众包工作者或诸如研究助理等训练有素的标注者来手动进行。

通常情况下,训练有素的标注者先创建一个相对较小的黄金标准数据集,然后雇用众包工作者来增加标注数据的数量,进行重复性工作。根据规模大小和复杂程度,数据标注任务有时会非常费时费力,不仅需要花费一定的人力成本,而且也不能保证数据标注的质量。

那么,能否让机器帮助人类完成这一基础任务呢?

在以往的认知中,机器并不擅长这类“慢工出细活”的任务,但出乎意料的是,“数据标注”这件事已经让 ChatGPT 完成了,而且比大多数人做得还更好。

d087ba21f9f6158ac7dfcd11f09db8b6.jpeg

在一项今天发表的新研究中,来自苏黎世大学的研究团队使用由 2382 条推文组成的样本,证明了 ChatGPT 在相关性、主题和框架检测等标多个注任务上优于众包工作者。

相关研究论文以 “ChatGPT Outperforms Crowd-Workers for Text-Annotation Tasks” 为题,已发表在预印本网站 arXiv 上。

具体来说,ChatGPT 在五项任务的四项中的零样本(zero-shot)准确率超过了众包工作者;在所有任务中表现出的编码者间一致性(intercoder agreement)方面,ChatGPT 不仅超过了众包工作者,也同样超过了训练有素的标注者。

64af832bf6edf88ded214aac810d4420.png

图|ChatGPT 零样本文本数据标注表现。(来源:该论文)

值得一提的是,ChatGPT 的每个标注成本只有不到 0.003 美元,而比数据标注平台便宜约 20 倍。

研究团队认为,虽然需要进一步的研究来更好地了解 ChatGPT 和其他 LLMs 在更广泛的背景下的表现,但该研究结果表明,它们有可能改变研究人员进行数据注释的方式,极大地提高文本分类的效率,并破坏数据标注平台的部分商业模式。

至少,从目前来看,这些发现表明了更深入地研究 LLMs 的文本标注特性和能力的重要性。

未来,研究团队将在 ChatGPT 在多种语言中的表现、ChatGPT 在多种类型的文本(社会媒体、新闻媒体、立法、演讲等)中的表现、使用思维链(CoT)提示和其他策略来提高零样本推理的性能等方面继续努力。

值得一提的是,研究团队在进行这项工作时,OpenAI 还没有发布 GPT-4,如果让 GPT-4 来完成数据标注任务,又会是怎样的结果呢?

论文链接:

https://arxiv.org/abs/2303.15056

编辑:文婧

c9de9f22c644aaac77de2666103dce04.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23169.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

必须了解的不同地区的支付方式FP独立站安全收款方式

跨境收款是跨境电商自建站系统最重要的功能之一,其收款方式一直是众多独立站卖家特别是做fp独立站的最为关注的问题之一,加上chatgpt出现,对fp独立站的检测审核更加严格,那么,你知道要怎么做才能安全收款吗&#xff1f…

互联网晚报 | 马斯克、苹果创始人等科技人士发公开信叫停人工智能开发;钟薛高推出3.5元雪糕;理想回应雷达在无人陵园显示全是人...

马斯克、苹果联合创始人等千名科技人士发公开信叫停人工智能开发:对社会和人性存潜在风险 据报道,包括马斯克、苹果联合创始人斯蒂夫沃兹尼亚克在内的1000多名人工智能专家和行业高管日前签署了一份公开信,他们呼吁将AI系统的训练暂停六个月&…

月薪30k,要求会用chatgpt写代码

首先声明这不是招聘广告。是我朋友圈猎头发的招聘信息,我只是看到有个条件要会chatgpt写代码。 真的有公司招聘chatgpt程序员写代码。所以会chatgpt是多了个出路,并不会替代程序员。

【Paper】英文文章图表规范和文献引用格式

两年前,第一次写文章的时候遇到了各种问题, 引用格式是错的,没见过三线表,图片尺寸和文章不搭,不知道怎么管理文献,不知道方法和结果章节的区别…… 两年后,我变强了,也变秃了 好…

电子文献引用 引用csdn

我瞎写的,不知道对不对,网上实在难找(参考文献如果是网页的话应该怎么写格式?): WGS.连续变量分箱[EB/OL].csdn,2020-11-20[2022-05-02].https://blog.csdn.net/qq_42363032/article/details/10…

使用HistCite进行文献引用分析

[前言]每一位科研工作者,在进入一个新的领域或课题时,都希望找到该领域最有价值的论文进行阅读。那么,通过分析该领域全部论文的引用关系就可以找到被引用最多的论文、最原始的文献,从而进行有针对性的阅读。 本文介绍如何通过Hi…

服务器响应很慢的分析与解决

1、背景 最近部署了一台web服务器,上架后用户那边反映打开很慢,我尝试用外网打开发现确实慢,包括ssh登录就特别慢,于是产生了分析与解决的想法。 2、分析 检查了网线和上联端口的带宽,发现都没问题,ping10…

接口响应过慢的原因排查,希望对你有用

最近一次的项目体验,手机用户在训练完成之后,会有服务器超时的提示,在用户量大的时候,每晚的7-9点时间段发生的尤为频繁,所以作了一些的排查。 排查的顺序乃是这样的: 确定是哪个接口存在性能问题 确定这…

构建类ChatGPT产品的经典知识数据库的原理与路径

构建经典知识数据库是类ChatGPT产品发展不可或缺的关键阶段。这一阶段的重要性在于为类ChatGPT产品打下基础,为自然语言大模型提供坚实可靠的文献资源,成为其最终的依据。 经典文献知识数据库与人工智能的结合将发挥独特的重要作用。实际上,…

当以ChatGPT为代表的AI进入教育,会碰撞出怎样的火花?

ChatGPT是当前的社会热点,街头巷尾、各行各业都在讨论它,迅速引起了全世界的关注。目前,在国外,ChatGPT已经开始进入学校。当以ChatGPT为代表的AI进入教育,会碰撞出怎样的火花? INSA校友卢宇,这…

还在转发杨超越?参加这场图表大show,你就能成为锦鲤本鲤!

Biu~ 暑假快要过去了 马上就要开学了 惊不惊喜? 意不意外? 听到这个消息, 在校学生 啊,我的空调、WiFi、西瓜 高校教师 啊,我的大好河山!(世界那么大... 职场白领 我就静静地听着你们诉(哀&…

ChartGPT有点意思,还能这么玩

ChatGPT是OpenAl开发的一种语言生成系统,具有较高的自然语言理解和对话管理能力。 所以它常用于对话机器人,比如说某爱、某度等,同时也可用于自动回复、问答系统等,对搜索引擎的智能化都带来不少新的挑战和方向。 然而目前ChatGP…

快速生成一份ppt:ChatGPT+MindShow

一、ChatGPT 需要用到目前全宇宙最火的chatgpt,输入格式一定要markdown格式输出 帮我做一份《xxxx》的ppt,帮我写一份包含6个子标题的大纲,每个子标题下尽量写4-5条内容,内容尽量详实,如果有例子更好。最后用markdown…

大厂被裁,我也曾迷茫过

大家好,我是徐公,6 年大厂程序员经验。 最近收到好几位粉丝的私信。问我说,徐公,我去年年底被裁,到现在还没找到工作,挺焦虑的,你这边有没有什么机会,可以帮忙内推?或者…

高通面试01_2023.5.16

1. 64QAM与16QAM速率对比 64 2^6,6bit信息/符号; 16 2^4,4bit信息/符号; 6/4 1.5倍数 2. 人工智能热点关注(ChatGPT) GPT “生成性预先训练转换器”(generative pretrained transformer) 百科&…

某平台百万阅读博主,去面试阿里P7,遭面试官狂喷:根本不懂技术,闭关60天,吊打曾经面试官,史上最强

某平台百万阅读博主,去面试阿里P7,遭面试官狂喷:根本不懂技术 一气之下回家硬肝60天,再战阿里又遇到当初面试官!轻松拿下阿里P7后说出实情,竟只是凭借这个文档! 首先声明: 本书覆盖了近3年程序员面试笔试中超过98%Java高频知识点当你细细品读完本书后,各类企业的of…

Hadoop常见面试题

目录 什么是hdfs 原理 包含哪些部分 hdfs 的读取过程 hdfs 的写过程 NN 和 2NN 工作机制 (元数据持久化机制) (一)第一阶段: NameNode 启动 (二)第二阶段: Secondary NameNode 工作 datanode的工作机制 小文件处理方案 yarn 的运行原理 任务提交…

重磅消息!微软将把聊天机器人技术植入Office办公软件

微软(Microsoft)是一家美国跨国科技企业,1975年4月4日创立。2021财年微软营收为1681亿美元, 净利润为613亿美元,公司总部设立在华盛顿州雷德蒙德(Redmond,邻近西雅图),以…

刚刚,谷歌翻车了。。。

大家好,我是微笑。 最近微软出品的 ChatGPT 确实引起很大的关注,这不,谷歌就紧跟发布了谷歌版 ChatGPT - Bard,结果很。。。 源自:机器之心 原文:https://mp.weixin.qq.com/s/1mkAlJbtYCmQcz_mV9cdoA 如今的…

LangChain:基于ChatGPT对话私有数据

一、架构图: 二、思路: 通过embbeding获得文本的语义,通过向量数据库获得近似记录,通过chatGPT得到问答内容将文件拆分并embbeding后存入向量数据库将用户问题embbeding后从向量数据库中找近似的文档数据作为prompt上下文 三、核…