ChatGPT时代:数据标注会成为一种人机交互“语言”么?

   标注猿的第70篇原创  
 一个用数据视角看AI世界的标注猿  

大家好,我是AI数据标注猿刘吉,一个用数据视角看AI世界的标注猿。

从去年的10月份到现在有半年的时间没有更新了,去年没有更新是疫情的原因,今年没有更新主要有两个原因一是因为在拼命的“活着”,二是变化太快了,有点懵状态。

到去年年底或许行业内有超过一半的标注供应商公司倒闭,不在从事相关业务了。当然也有一部分公司转型成功了,据我了解有一些转型做抖音的相关业务也有比较好的结果的。当然也有越做越大的小伙伴,非常令人佩服。

所以在年初的时候也跑了一些地方和一些行业内的大牛们聊了聊,本来在聊完之后想写一篇文章,但是聊完之后感觉没有写的意义了。

随后的一个多月里ChatGPT席卷全球,又看不懂了,感觉整个国内的人工智能行业都被打蒙了“1秒”。

最近又和一些小伙伴交流,也请教了一些大咖,关注一些行业的信息,也有了一些思考,决定还是回归数据视角看AI的本质,去写一些内容和大家分享交流。所以本文就从三个方面和大家聊聊:

  • 数据标注业务的增量在哪?

  • GhatGPT的冲击

  • 数据标注会成为一种人机交互“语言”么?

一.数据标注业务的增量在哪?

总所周知,数据标注行业的业务从数据类型上类区分是图片、音频、文本、视频,而目前行业主体的业务需求大多来源于图片类的,而图片类的大部分需求源于自动驾驶相关标注的业务。

年初的时候,看到一篇36氪发布的一篇文章,文章介绍了几个标注服务商公司的业务增长非常高,有的都已经达到了442%,而一些主机厂的数据标注的投入也从几十万、几百万增长到了数千万甚至大几千万的级别。

所以至少在3月底之前大家对于数据标注今年的市场增量还是信心满满,预期着自动驾驶厂商今年的投入有会有一个非常大规模化的增长。

但是能单纯的认为是数据标注行业的增量么?或许是否定的,单从自动驾驶标注业务来看,实际客户源是很有限的,国内能做的起自动驾驶的公司和主车厂是非常有限的,而愿意实打实花大资金重投的或许是更有限的。

源于自动驾驶业务带来的增量在数据量上的确有增加,但是如果客户数量没有增加的话就会促使内卷进一步加剧。所以从行业增量来说,我认为是没有增量的,毕竟客户总量几乎没有增加。

逻辑很简单,一个主机厂不会把“鸡蛋”放到一个篮子里,而能接主机厂的数据标注供应商大多是规模比较大(关系户)或者平台方,而一般至少也会找3家及以上,那么竞争就来了,或许你会在不同的平台看到同样的项目,价格却不一样。

而从目前来看已经到了5月份、6月份了,年初所预期的井喷式的任务却没有如期而至,是大环境不好预算减少了、还是技术方案调整了?我们还不得而知。

二.ChatGPT的冲击

ChatGPT从文本类再到多模态的表现的确给所有人来了很大的冲击,虽然也有人认为没什么突破,就是数据量大了。但的确让每个人、每个行业都或多或少可以利用这个工具为自己做一些事情。

甚至有些人在思考ChatGPT会不会取代人类,会不会导致很多人失业?我认为不会取代人类,会让一部分失业,但是最恐怖的一件事儿是未来会有一部分人慢慢会会被AI提供的信息所供养。

ChatGPT对我冲击最大的两点是:

  1. 有意思的是在ChatGPT出现以后,很多投资人很多公司疯狂的开始吹捧大模型,虽然不知道最终会留下几家,毕竟这种基础的大模型投入太大,而最终能站到“金字塔”尖会非常少。

    但这个过程也发生了一些非常有意思的事儿,最先通过ChatGPT赚到钱的人却是一批教普通人使用ChatGPT的人。从如何注册到如何使用,甚至看到了教别人如何向ChatGTP提问才能得到更好的答案。

    看到这点的时候,从数据的角度我突然意识到一个问题,“问题也是ChatGTP的一种数据”

    这种问题在标注里面我们通常称为“问题泛化”、“问题扩展”。但这种问题的泛化、扩展其实很难通过标注人员人为的处理。所以才会出现很多人问的问题也想要的答案有出入,但是如果换一种方式问,可能就会得到更贴切的答案。

    那么在ChatGPT3.5到ChatGPT4对外开放的迭代时间用了大概半个多月的时间,或许从数据标注的角度来看,应该是更多的训练了一次在3.5开放之后问题的数据。

    所以在无意间每个使用过ChatGPT的人都成为了ChatGPT标注员,帮助它进行了一次有一次的标注。

      • ChatGPT数据的数量级

        国内的公司或许也不会拿出上百亿美元的资金去做研发,而还有一部分又要花费在数据标注这个“无底洞”上面。

      • 聚焦场景化解决方案和大模型

        从这几年国内一直看重的场景化解决方案,不太看好大模型的发展。而ChatGPT3.5和ChatGPT4打破了国内的很多认知。

        记得前几年的每年在参加很多地方举办的人工智能年度大会上,很多专家对大模型的不屑一顾,对场景化模型的吹捧还历历在目。

三.数据标注会成为一种人机交互“语言”么?

ChatGPT这种大模型的出现,之所以会席卷全球,除了有过硬的技术外,还有一个核心的问题就太易用了。任何一个非相关专业的人员,甚至都不需要多高学历的人员就可以使用。

易用、好用、就会变的易传播。

但热情退去,如何解决大模型在实际应用中“最后一公里”的问题呢?

不管是问答类、还是多模态的大模型,在我们问具体问题的时候,都会有一种感觉,看似给你了一个很“丰满”的答案,但只要你细研究,这个答案又好像没啥太大用,有一点像“废话文学”。

这也会是后面大模型落地时候的一大痛点,商业化的一个阻碍。看似非常有用,但在具体问题上有没啥用的尴尬。

这个时候在看看ChatGPT在解决问题数据泛化、扩展的思路,以及特斯拉在自动驾驶解决数据的思路就有异曲同工之妙了。

对于大模型人机交互在解决“最后一公里”问题,自主的数据标注就变的尤为重要了。

首先可以肯定的是想要ChatGPT解决很实时的具体问题时候,一定是需要给ChatGPT“投喂”一些相关的数据信息的,那么这一个过程其实就是一次数据标注的过程,但是否对于ChatGPT是有效的,我们是无法确定的。

对于数据标注来说,在大模型的长尾阶段一定是必须的,但这种必须又好像是我们在跟机器做了一次又一次的“对话”,来告诉机器我们要做什么,而这个数据标注的过程,是否可以变成一种特定的“人机交互语言”来实现呢?

作为普通人来使用AI,我们不关系技术实现、代码落地等等复杂的内核,我们更要关注的是自身的需求,并提出问题,完善问题需求,然后让AI来帮我们解决。

如果从这个角度来思考的话,数据标注是否更像是人机交互的一种语言呢?

以上就是最近关于数据标注相关内容的一点点思考,欢迎小伙伴留言讨论交流。

相关文章阅读:

  1. 自动驾驶测绘资质的信息安全要求,真的来了

  2. 甲方数据负责人供应商选择系列一

  3. AI数据标注猿知识星球私域社区开始招募啦!【文章最下面有公众号福利】

  4. 数据标注员是职位,人工智能训练师是职业

  5. 数据标注行业创业还可以么?

-----------------------完--------------------

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25611.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Plus 版 Chatgpt,和任何的 PDF 聊天! #Chatpdf

Chatgpt 的出现,颠覆了整个内容生产行业的同时,也极大地提高了很多文字工作者的效率。 于是一时之间,各大公司都在争先推出自己的聊天机器人,希望在这个新兴而庞大的市场分一杯羹。‍‍‍‍‍‍‍‍ 于是 Chatpdf 出现了&#xff…

大厂程序员手把手教你如何写简历(附简历模板)

代码随想录刷题网站上线咯:programmercarl.com,200道力扣题目刷题顺序,详细题解,支持C、Java、Python、Go、JS等多语言版本,一个你只要发现,就会收藏的硬核算法学习网站。 文章目录 简历基调谨慎使用精通两…

ChatGPT做的简历戳中HR心巴,小伙刚毕业就拿下梦想offer!

西风 发自 凹非寺量子位 | 公众号 QbitAI 鹅妹子嘤,最近一位毕业生用ChatGPT生成的求职信,分分钟躲过简历筛选算法。 然后,自己梦寐以求的工作就真的到手了! 这位用ChatGPT帮忙找工作的小伙表示: 三月份以来写所有东西…

软件测试个人求职简历该怎么写,模板在这里

目录 1、个人资料 2、专业技能 3、工作经验 4、项目经验 5、教育背景 1、个人资料 姓 名:xxx 性 别:x 手机号码:138888888xx 邮 箱: xxx 学 历:本科 专 业:电子商务 英 语:四级 当前工作…

程序员简历应该怎么写?

说到程序员简历,这两个月,我看过不下10,000份简历。。。 答主不是HR,也不是技术负责人,但是在网站的运营工作中,每天最开心的事情就是研究候选人的简历了~~ 这些人中,有BAT的资深大牛程序员,也有…

建议这样使用ChatGPT,让你成为更好的开发者

这样使用ChatGPT,让你成为更好的开发者 作为开发人员,您的责任之一是不断学习和提高您的技能。ChatGPT 是一个强大的工具,可以通过多种方式帮助您成为更好的开发人员。如果你不知道什么是 ChatGPT,它是 OpenAI 开发的一种大型语言…

大会线上同步直播, 来不到现场也可以线上看直播,以及参会秘籍

紧急提醒:还有1天! 2020.NET开发者大会就要开幕啦! 你都做好参会准备没有? 特殊时期,为方便小伙伴们顺利参会,小编特意整理了这篇大会参会攻略,大到各种日程安排、小到签到、出行、防疫等&#…

10、记录使用科大讯飞的语音唤醒硬件生成PCM文件,通过ffmpeg库去生成MP3音频文件

基本思想:不太会ffmpeg解析pcm的音频文件,所以记录一下结合具体的场景和具体的应用 具体生成的pcm使用的官方代码,不详细叙述,官方的唤醒模块将会产生一个pcm文件,可使用下列命令或者代码将pcm转成mp3文件&#xff0c…

深兰科技亮相2023数博会:硅基知识大模型推动个人数字化产业

近日,2023中国国际大数据产业博览会 “数字经济与实体经济深度融合”论坛在贵阳举行。腾讯云、京东集团、网易、深兰科技等8家企业负责人进行了行业演讲。 作为2023数博会的专业论坛之一,本次论坛以“数融百业 创变赋新”为主题,从数实融合视…

吴怀宇 | 对比欧盟,中国的《人工智能法案》应有什么底座?

来源:OpenDAI 作者:吴怀宇 中国科学院博士、北京大学博士后 2023年6月14日,欧洲议会全体会议表决通过了《人工智能法案》授权草案,标志着该法案将进入欧盟立法严格监管人工智能技术应用的最终谈判阶段。欧洲议会此前曾发出声明&a…

希尔伯特旅馆里,住着AI的某种真相

“无穷”和“无穷1”,哪个更大? 已经吸收了不知道多少数据的AI模型,和比他多学习一条数据的模型,哪个更智能? 想聊聊这个问题,出于一个偶然的机会。很早之前我在测试ChatGPT的时候,突然想问他个…

AI大时代——一次全新的生产力革命

✏笔者按: 我这个人是比较笨的,我是在3月9日左右才恍然意识到一个崭新的AI大时代已经到来了。 全文7339字,阅读需要约10分钟 >>前言 我是在大三时候阅读《游戏编程中的人工智能技术》这本书的时候接触到的人工智能和神经网络的相关…

“AI教父”Geoffrey Hinton:智能进化的下一个阶段

来源 | The Robot Brains Podcast OneFlow编译 翻译 | 杨婷、贾川 ChatGPT等大模型带来的震撼技术革新,让Geoffrey Hinton突然改变了自己的一个想法。 这位75岁的“人工智能教父”意识到,数字智能优于生物智能的进程无法避免,超级智能很快就会…

为什么说 AI 将拯救整个世界?

【CSDN 编者按】AI 会让我们失业吗?AI 会“杀”死人类吗?当一门重要的新技术横空出世的时候,人们总是会担心它给人们带来的种种威胁,基于此,本文作者认为,虽然 AI 风险很高,但也存在非常有影响力…

从破解虫脑到攻克人脑:一条“永生之路”的新赛道?

从破解虫脑到攻克人脑:一条“永生之路”的新赛道? 首张果蝇大脑连接组:耗费十余年,重建三千神经元,超50万突触! 论文地址 果蝇幼虫大脑的连接组。 所有脑神经元的形态学都经过了突触分辨率的电子显微镜成像…

大模型技术发展概述 -(三)

文本内容参考论文《A Survey of Large Language Models》 论文标题:A Survey of Large Language Models 论文链接:https://arxiv.org/pdf/2303.18223v10.pdf 大模型技术发展概述 -(三) 5. 适应性调整LLM5.1 指令(Instr…

C++爱心代码

C爱心代码 效果图 代码 #include<stdio.h> #include<Windows.h> int main() {float x, y, a;for (y 1.5; y > -1.5; y - 0.1){for (x -1.5; x < 1.5; x 0.05){a x * x y * y - 1;putchar(a * a * a - x * x * y * y * y < 0.0 ? * : );}system(&…

C语言爱心代码,C语言爱心代码合集(附源码)

1、love图案的C语言爱心代码 C语言爱心代码如下&#xff1a; #include <stdio.h>int main(){int i, j, k, n 0, x 0, y 50;//爱心的头部没有规律&#xff0c;所以直接打印printf("\n\n\n\n\n");printf(" lovelove lovelov…

编写爱心代码

# -*- coding: utf-8 -*- from turtle import * def curvemove(): for i in range(200): right(1) forward(1) color(red,pink) begin_fill() left(140) forward(111.65) curvemove() left(120) curvemove() forward(111.65) end_fill() done()

爱心代码—(免费分享)

可加名字 的爱心 可变颜色 方法很简单 首先在桌面新建一个文本&#xff1a; 然后在复制我下面的代码在文本里面并保存&#xff1a; <!DOCTYPE html> <html> <head> <meta charset"utf-8" /> <title>&#x1f497;</ti…