标注2.0:数据标注员如何进行从业选择?

作为一个2020年3月份才正式正名的一个岗位,开始就受到了很多关注,但也引发了很多争议。经过几年的发展人工智能很多领域已经落地初见成效,数据标注也逐渐要进入一个“洗牌期”。但很少有人关注从业者的发展,不管是在百度还是知乎去查找都很难找到一个很好的职业前景的说明,得到的标签基本都是“简单”、“重复”等等。那么在疫情之下可以吸收大量就业的岗位,作为从业者或者即将从业到底该如何选择?

    到目前阶段个人不太赞同再把数据标注员比作AI的老师,去教AI如何认识世界。对于老师来讲“教”这个事情其实是不用对特定情况下结果负责的,而标注这件事发展到目前阶段则不然,更像“调音”的过程,是一个技术活,所以想要真的做好,就要更准确的理解并可以通过标注的方式进行“调音”。

    所以本文重点从实际公司需求出发来分析,目前对于求职者如何更好的选择同时在这个行业发展的更好。下面我们从两大方面进行一个详细分析:1.职位和对应薪资,2.职位对应的要求。

      本文原始数据主要采集自知乎、智联、猎聘、Boss、拉钩。

一.行业本身衍生出来的职位类型

      首先我们先了解一下目前市场需求的数据标注的职位类型有哪些?个人认为行业初期行业内职业类型的单一是很正常的,由于粗狂发展最直接的赚钱并且最小的投入才是硬道理。但目前的阶段这个行业有哪些职位可以供大家选择?

      1.可以看出来需求量最多依然是标注员的岗位,其次是审核员、经理,很容易理解这是基础的需求,其他岗位更多的也是从这个岗位衍生出来的。对于公司来讲也是最直接盈利点。

       2.从需求量上来看,目前审核情况基本上是1:12,当然不排除审核员很多会有内部标注员晋升到质检员的情况,但是这个数字也基本在合理范围内。

       3.从需求量上也可以看出,目前经理管理人员情况是1:21,目前也是比较合理的。

       这里有两点值得注意,a.销售人员的需求量非常少,b.出现了明确针对数据标注行业的测试和产品的需求。这个也是值得各位小伙伴关注的。

二.对应岗位基础薪资情况

        对应岗位的工资相比也是大家非常关心的问题,那么可以看到目前市场需求上的对应工资排名情况(此部分为基础工资)。

   1.显而易见上面提到的需求量相对少的销售岗位是这个行业基础薪资最高,这个就很容易理解作为一个新兴的行业,销售不依赖于销售员,而是渠道为王,更多的是老板就是主要的销售手段。

 2.在这里很明显的可以分出我们传统意义上的管理岗位和技术岗位,管理岗如总监、经理、主管,技术岗:测试、产品。

   3.作为一个新兴的行业相对已有的成熟行业来讲,其行业衍生的岗位已经基本形成。

三.不同地域对于不同岗位的需求

    很容易可以看到对于不同岗位需求度越丰富的地区,行业相对于其他行业的发展就会更快,那么假设你是可以到外地工作的话,最好选择哪些城市呢?我们可以分析一下。

       1.可以看出从需求量上来说,北京、杭州、成都、深圳、上海、合肥的多样性会更多一些,可以说明行业在这些地方的发展相对较快。适合初入职场的同学去学习。

       2.对于主管、总监、经理需求量多的城市,如:成都、西安、苏州、石家庄、长沙、贵阳等地,新成立的数据公司相对会比较多一些。更适合一些已经有一些行业经验的人去。

       3.另外可以看出这个数据尾巴很长,涉及到中小城市很多,很符合我最近看的一篇关于说数据标注的工作让更多的年轻人又回到了家乡。

      上图是数据标注员在各个地区的平均薪资情况,可以看出如果是刚毕业想从事数据标注员的同学,从平均薪资上来看选择顺序应该是:上海、深圳、苏州、北京、成都、厦门。

四.地区公司量的角度

      某一个地区需求公司的多少也很大程度的决定了发展空间,毕竟选择行业是长远的,还要考虑到可跳槽的空间。

          可以看出北京是当之无愧的榜首,其次杭州、上海、成都、深圳也是可以选择的。这样分析下来是不是有了心怡的地方了呢?

五.职位要求有哪些?

      上面我们分析了需求公司的情况以及薪资情况,那么最重要的这份工作到底怎么干呢?接下来我们分析一下不同职位的岗位需要具备哪些能力呢?

 1.标注员

    以文本为例:最低薪资和最高薪资的岗位要求有哪些不同呢?

  • 最低薪资:

    职责描述: 

    1、快速学习掌握语义业务功能,掌握掌握司法知识和标注平台、工具功能; 

        2、进行日常语义需求的标注、问题反馈及需求总结; 

    任职要求: 

        1、语言学、法学相关专业,有较好理解能力; 

        2、熟练使用办公软件; 

        3、学习接收能力强,工作认真细心,责任心强有团队意识,有一定抗压能力;

  • 最高薪资:

    工作职责: 

    1.深入理解和分析金融、保险、物流、证券等行业数据,并负责完成数据生产、标注、维护; 

    2.数据标注及检查:对不同项目所需的标注数据进行情感标注、关系判断需要根据语句判断两个实体及他们之间的关系是否准确; 

    3.能依据产品需求,对标注数据进行总结、分析,定期总结标注经验,提供标注工具的使用完善建议。 

    4.对接算法研发同事及数据标注人员,确保数据标注人员输出满足算法研发需求的数据。 

    任职资格: 

     1. 专科及以上学历,语言学、信息管理、中文信息处理等方向优先; 

     2. 熟悉使用办公软件,擅长excel最佳,大数据和算法是加分项; 

   3. 语言表达流畅,能理解数据需求,善于发现问题并及时反馈,具有敏锐的数据分析能力,办事踏实认真仔细; 

   4.具备敏捷的观察、判断能力,以及逻辑思维能力,具团队合作精神,有强烈的责任心和敬业精神; 

    优先条件: 

    1.有保险电话客户从业经验优先; 

    2.相关项目经历:词库、知识库建设等; 

    3.对词库、知识库建设;信息分类整理方向有浓厚兴趣。

    很容易就可以看出要求的不同,当然也很客观的体现在薪资上了,所以如果想从事相关的小伙伴一定能要理解要面试公司的需求。在这里我们可以分析出来几个关键词:

  • 深入理解(对场景的深入理解)

  • 标注和审核(最基本的需求)

  • 可以依据产品需求(可以根据场景来处理数据)

  • 能与算法研发和标注员对接(能把场景需求和算法之间的关系进行转化)

  • 专科及以上学历(这个也是很关键的点也是新毕业同学的机会所在)

2.测试

  • 最低薪资

        岗位职责

          1、负责环视项目素材的采集和整理; 

          2、有效地执行测试用例,提交测试报告; 

          3、准确地定位并跟踪问题,推动问题及时合理地解决; 

          4、欢迎2020届毕业生投递;此岗位有毕业后留任机会。 

        岗位要求 

          1、计算机及相关专业专科以上学历; 

          2、熟练操作电脑和Excel,工作态度严谨。 

          3、逻辑思考能力强,有良好的学习能力; 

          4、对软件测试领域发现、分析和解决问题有浓厚的兴趣; 

          5、责任心强,工作积极、主动,注重总结; 

          6、有代码基础者优先,熟悉MongoDB数据库搭建语言,熟悉Linux系统下C编程优先。

  • 最高薪资

 

        岗位职责: 

           1、负责人工智能深度学习算法的测试计划、测试用例的编写和测试执行; 

           2、负责人工智能深度学习算法的数据标注和审核; 

           3、负责人工智能数据标注工具的编写; 

           4、负责常规的数据测试和标注人员的管理、监督工作。

        任职要求: 

           1、本科及以上学历,电子、自动化、通信、计算机类相关专业毕业;            2、负责人工智能深度学习算法测试和SDK应用测试工作; 

           3、负责人工智能深度学习数据标注规划以及审核等工作; 

           4、熟悉Python语言,能自己编写一些标注工具者优先。 

           5、具有快速学习能力和团队合作精神, 善于交流。

3.管理岗

        岗位职责: 

            1、对AI业务数据标注和采集项目的完整生命周期负责,建立完善的标注和采集的流程,推动业务向规范化和规模化方向前进,定期对服务的项目进行总结和经验提升; 

             2、负责深入挖掘客户的需求并确认,和客户进行充分的沟通,保证项目的质量和进度,有效的控制项目风险,完成交付,提高客户满意度; 

            3、参与数据标注和采集业务的运营和决策,为该业务线总监提供强有力的支持,包括流程化管理、标注人员素质提升、第三方渠道维护和开发等一系列业务方面的工作; 

       岗位要求: 

            1、对人工智能行业的算法情况有一定的了解,掌握主流的文本、音频、图像方面对标注类型、质量管控等方面的要求; 

               2、具有数据标注和采集行业的服务经验2年以上;

            3、有较强的统筹协调能力,做事细致,认真负责,具有良好的抗压能力和快速应变能力;

      综上不管是基础岗位还是技术岗、管理岗位,对于能力的需求都是非常明显,如果你想从事相关工作,一定要会的能力也非常显而易见。同学们可以借鉴以上的需求对应学习。

 

 

      今天文章有点长了,基本上从两个方向梳理了一下目前阶段数据标注行业如果想选择的话的需求以及前景和公司的要求。这个是一个新兴的行业有很多机遇也有很多挑战。最近也跟一些大学的老师交流,一些大专和本科也开设相关的大数据、人工智能的课程,但是就连老师可能很难讲清楚学生毕业了该如何选择工作,而数据标注或许是一个很好的选择。

      最后我想说不管任何职业任何岗位都缺少不了用心、细心、专心。疫情影响很多传统岗位都面临着减员的情况,而数据标注行业的缺口依然巨大,所以希望本文可以帮助大家更清晰的梳理方向,也欢迎大家留言交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38161.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Tina_Linux_syslog_使用指南

Tina Linux syslog 使用指南 1 基本介绍 syslog 可以说是一套统一管理系统日志的机制,尤其常用于记录守护进程的输出信息上。因为守护进程不存在控制终端,它的打印不能简单地直接输出到stdin 或 stderr。 使用syslog 时,一般需要关注两部…

Linux外壳程序编程 shell编程 引号详解

shell是命令语言、命令解释程序及程序设计语言的统称; shell是一个命令语言解释器,它拥有自己内建的shell命令; Shell(Bash)单引号、双引号和反引号用法详解; 尽量使用 $(命令) 的方式来引用命令的输出,…

【OS命令注入】常见OS命令执行函数以及OS命令注入利用实例以及靶场实验—基于DVWA靶场

目录 1 OS命令注入概述2 常见OS命令注入函数及例子2.1 system()函数2.2 exec()函数2.3 shell_exec()函数2.4 passthru()函数2.5 popen()函数2.6 反引号结构 3 OS命令注入漏洞的利用3.1 查看系统文件3.2 显示当前路径3.3 写文件 4 OS命令注入漏洞的防御5 OS命令注入漏洞靶场实验…

Linux —— tftp 使用

提示:tftp 命令在 uBoot 系统和 Linux 系统下的使用是不一样的 前言 在 Linux 移植过程或裸机开发中,经常要使用到 tftp 命令,本文围绕该命令相关的网络配置及使用做出记录,本文中,开发电脑命名为上位机,新…

linux 之TFTP的使用

简介 TFTP是用来下载远程文件的最简单网络协议,它其于UDP协议而实现。嵌入式linux的tftp开发环境包括两个方面:一是linux服务器端的tftp-server支持,二是嵌入式目标系统的tftp-client支持。因为u-boot本身内置支持tftp-client,所以…

嵌入式linux与windows之间的tftp文件传输(保姆级)

目录 前言一、为什么要文件传输二、利用共享文件夹(简要流程)三、tftp传输与环境搭建四、传输前的准备工作五、测试准备工作是否完成六、传输文件6.1、windows中tftp32的配置6.2、嵌入式Linux(板子)中获取或发送文件6.2.1、tftp命令用法 前言 在我们接触嵌入式Linux之前&#…

用于医疗领域的聊天机器人ChatDoctor

ChatGPT系列文章 文章目录 ChatGPT系列文章ChatDoctor数据集模型训练参考资料 ChatDoctor ChatDoctor: A Medical Chat Model Fine-tuned on LLaMA Model using Medical Domain Knowledge 论文地址:https://arxiv.org/pdf/2303.14070.pdf 在通用领域中的大型语言…

2021年中国互联网行业投融资运行现状及未来发展趋势分析[图]

互联网指的是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。 一、全球互联网行业投融资运行现状 国际环境更趋复杂严峻,世界经济复苏放缓,通胀压力上升与疫情蔓延交织。2021年…

2021年中国企业风险投资发展现状及未来发展趋势分析[图]

企业风险投资是指有明确主营业务的非金融企业在其内部和外部所进行的风险投资活动。企业从事风险投资的形式主要有两种:一种是把用于风险投资的资金委托给专业的风险投资公司进行管理,由其成立的投资基金根据委托方的战略需要选择投资目标;另…

最强对话模型 ChatGPT 向 Google 搜索发起挑战

GPT-3 发布的两年后,我们没等来它的亲弟弟 GPT-4,而是在今天亲眼见证了 OpenAI 带来了一种全新的 AI 聊天机器人——ChatGPT,也可以称之为是 GPT-3 家族里面的亲戚,它不仅可以解释代码、编写情景喜剧脚本,也可以为用户…

Google 新一代音乐识别

文 / Google AI 苏黎世办公室 James Lyon 2017 年,我们发布了具有闻曲知音功能的 Pixel 2,就是利用深度神经网络为移动设备带来低功耗、始终开启的音乐识别功能。在开发 “闻曲知音” 时,我们的目标是打造一个小巧高效的音乐识别器&#xff0…

谷歌AudioLM :通过歌曲片段生成后续的音乐

AudioLM 是 Google 的新模型,能够生成与提示风格相同的音乐。该模型还能够生成复杂的声音,例如钢琴音乐或人的对话。结果是它似乎与原版没有区别,这是十分让人惊讶的。 为什么生成音乐如此困难? 创作音乐并不是一件容易的事。生成音频信号&…

“程序员交友网站” SO 突然裁员 10%,网友:ChatGPT 出来后就不咋用了

在ChatGPT影响下,知名开发者问答社区Stack Overflow撑不住要裁员了! 随着用户大规模转战ChatGPT,Stack Overflow访问量大幅骤降,且盈利情况不容乐观。 CEO Prashanth Chandrasekar在公开信中坦言:正处于困难时期。 具…

巴比特 | 元宇宙每日必读:浙江发布2023年元宇宙产业发展工作要点,6月底前组建元宇宙产业联盟,年底打造20家“专精特新”企业...

摘要:据浙江省发改委官网 4 月 24 日消息,浙江省发改委等 5 部门近日联合印发《浙江省元宇宙产业发展 2023 年工作要点》。《工作要点》制定了十六项主要任务,并提出在2023 年 4 月底前建立元宇宙部门工作协同机制;6 月底前组建元…

免费版GPT-4!美国AI初创公司推出Forefront Chat,火到官网崩溃

免费版 GPT-4 到底香不香? AI初创企业正式推出Forefront Chat 近日,Forefront AI 正式推出 Forefront Chat,允许用户免费体验 GPT-4 的强大功能。ForeFront AI 是一家总部位于纽约的软件开发公司,联合创始人分别为 Jimmy Grease…

VTK笔记-生成MIP图像-vtkImageSlabReslice类

MIP MIP(Maximum/Minimum Intensity Projection),最大/最小密度投影重建。   MIP可以较真实地反应组织密度差异,使得血管的异常改变、形态、走形强化;但是只适用于外观形态的显示。   在容积扫描数据中对每条径线上…

重温马云英文演讲:最伟大的成功

“机会在哪呢?”每当创业者发出这个疑问,我们就该重温马云的这段英文演讲,让奋斗的热血重新沸腾起来。你有什么。你有年轻的身体,你有奇妙的想法,你有乐观的心态,你有无限的可能性! 演讲全文&am…

马云退隐前,在年会上说了最重要的三件事

作者:黄小斜 今天是9月10号教师节,也是马老师卸任阿里巴巴董事长的日子,同时也是阿里巴巴召开20周年年会的日子。有幸抽中了门票,在现场见证这具有历史意义的一幕,马老师在中场时给我们带来了一段演讲,也是…

阿里巴巴CTO独家自述:CTO就是要给CEO扫清障碍和风险

CTO可能不是思想家,但一定是行动派。 本文来自《云栖战略参考》第二期,过程中鲁肃非常坦率地探讨了一位合格CTO应该具备的素质,以及他自己一路摔打成长的心路历程。 一 我的经历 我的经历很简单,2004年之前一直在学校读书&#x…

马云现身西班牙度假 半年多来首次在境外露面

这半年里,马云公开露面的次数不到三次,就连前段时间的世界互联网大会也不见他的身影。 极少数出现在公众视野的马老师似乎在努力低调,但是他的一举一动仍然受人关注。 西班牙多家媒体10月19日报道,马云上周六飞抵西班牙, 在伊维…