干货贴丨图像数据标注有哪些好用的工具

随着AI与传统行业的不断融合以及5G的发展,AI数据服务方式由粗放式向着精细化方向过渡,数据标注工具的发展也经历了从「能用就行」到「好用且高效」的阶段。

大家都知道不同的标注类型使用的标注方法、工具、存储类型都不一样,在了解图像标注工具之前,我们先来看看图像标注都有哪些数据类型。

01 图像/视频标注类型

2D框

给标注工具提供一幅图像,让其在图像内特定对象周围绘制一个框。

最简单的图片数据标注类型,成本最低,应用最广泛。

多边形分割

标注工具会通过在需要标注的对象的外边缘,放置许多个点来绘制成线,勾勒轮廓。

用于图片和视频中精确的物体检测和位置定位,更精准、更耗时、成本更高。

关键点标注

通过人工的方式,在规定位置标注上关键点,例如人脸关键点、骨骼点。常用于面部或姿势识别模型。

线标注

主要用于自动驾驶车辆的道路识别,定义不同道路。

语义分割

根据物体的属性,对复杂不规则图片进行进行区域划分,并标注对应的属性,以帮助训练图像识别模型,常应用于自动驾驶汽车、人机交互、虚拟现实等领域。

比较精准,耗时比较长,对图片上的所有内容进行标注。

视频标注

以帧为单位在一系列图像中定位和跟踪物体,多用于训练车辆、行人、骑行者、道路等自动驾驶领域的模型。

2/3D融合标注

通过3D点云数据,返求出2D图片的相对位置,对点云数据和图片数据同时标注。

用于多传感器融合平台的数据处理,多应用于自动驾驶场景。

02标注工具推荐

CVAT

CVAT是免费的、在线的、交互式的视频注释工具,它的灵感来自Vatic。支持本地部署,无需担心数据外泄。

网址: https://github.com/opencv/cvat

标注类型

1.多边形分割、语义分割、2D框、线标注、点标注

2.3D点云

3.视频标注

文件导出格式

CVAT for video、CVAT for images、PASCAL VOC、(VOC) Segmentation mask、YOLO、COCO、TFRecord、MOT、LabelMe 3.0、Datumaro

亮点/优势

1.支持多人协作

CVAT带有用户管理系统,可以创建、删除新成员,并为成员分配不同角色。如管理员、用户、标注员、质检员

2.标注功能强大

能用于几乎所有CV相关标注任务,如点,多边形,语义分割等,并且包含了插值标注即一个视频中若干帧,标注起始帧中间会自动生成、 带有标注任务列表的仪表板等功能

3.预处理功能

使用TensorFlow OD API的自动标注,可以预处理一部分数据

4.持续更新

开源环境较好,工具在不断完善中,有任何问题可以在gitchater问,回复很快

不足

1.没有「贝塞尔曲线」,只能一个一个点

2.只适用于谷歌浏览器,在其他浏览器中表现不佳

3.尽管 CVAT 支持一些自动测试,但所有质检都必须手动完成

4.由于Chrome Sandbox的性能限制,CVAT在某些用例中可能会出现性能问题

VOTT

微软发布的一款基于javascript开发用于图像目标检测的标注工具,使用React+Redux进行开发,支持Windows和Linux平台运行。分为V1和V2两个版本,目前V1已经废弃,V2是V1版本的重构和优化,建议大家直接用V2。

网址: https://github.com/microsoft/VoTT

标注类型

支持点、线、2D框、语义分割与视频数据标注

文件导出格式

CNTK/Pascal VOC、TFRecord、CSV、VoTT等格式

亮点/优势

1.安装方便,直接下载exe文件即可

2.VoTT的学习成本低、上手快

不足

1.不支持多人协作

2.VoTT的标注会超出图像的最大像素范围,如果模型对坐标有规定范围的话,则需要进行特定处理

3.数据无法加密保存,不适合私密数据标注

4.不能导入已有的标注结果(如bbox)

5.程序不稳定:VoTT是桌面应用,经常死机,经常会报错

Labelme

Labelme 是一个图形界面的图像标注软件。其的设计灵感来自于 http://labelme.csail.mit.edu/ 。它是用 Python 语言编写的,图形界面使用的是 Qt(PyQt)。

网址: https://github.com/wkentaro/labelme

标注类型

1.多边形分割、语义分割、2D框、线标注、点标注

2.视频标注

3.对图像进行进行 flag 形式的标注(可用于图像分类和清理)

文件导出格式

JASON、VOC与COCO

亮点/优势

1.用户定制界面

2.支持全面标注方式:与labelImg相比,labelme除了矩形框之外,还可以使用圆形框,多边形框,点,线等来对图像进行标注,用于目标检测、图像分割等任务

3.可以对图像进行flag形式的标注,用于图像分类和清理任务

LabelImg

LabelImg是图形图像标注工,用Python编写的,并将Qt用于其图形界面,可以用于进行目标检测项目的标注工作。

网址: https://github.com/tzutalin/labelImg

标注类型

2D矩形框,目标检测

文件导出格式

PASCAL VOC 、YOLO 、CreateML

亮点/优势

1.操作简单快速,而且生成的标注文件以XML文件保存,读取方便,格式标准

2.支持VOC2012格式与tfrecord自动生成

不足

支持的标注类型少:仅支持2D框标注

VIA-VGG Image Annotator

一款开源的图像标注工具,由Visual Geometry Group开发。可以在线和离线使用。可标注矩形、圆、椭圆、多边形、点和线。

下载地址:http://www.robots.ox.ac.uk/~vgg/software/via/

Github:https://gitlab.com/vgg/via

标注类型

1.多边形分割、语义分割、2D框、线标注、点标注

2.Version3增加了对视频和音频的标注

3.人脸标注

文件导出格式

csv和json

亮点/优势

1.人脸数据标注提供了各种方便的操作,人脸数据标注首选工具

2.网页源代码开源,可离线使用还可进行二次开发,比如增加鼠标十字线

3.标框可以复制(可前后帧复制),同样大小可直接复制且继承属性,属性面板较为清晰

4.适用多个浏览器:Chrome、Firefox、Safari、 Explorer、GNOME Web等

不足

多边形工具,一旦绘制完多边形无法增加锚点,只能调节点的位置

Pixel Annotation Tool

图像语义分割与实例分割标注神器,交互式标注算法思想是基于OpenCV中分水岭算法实现。

网址: https://github.com/abreheret/PixelAnnotationTool

也可以直接下载编译好的二进制文件使用,下载地址如下:https://github.com/abreheret/PixelAnnotationTool/releases

标注类型

语义分割与实例分割

亮点/优势

1.快捷,半自动化,类似PS蒙版,基于OpenCV中分水岭算法实现

2.可以返回上一步

不足

1.标注对象若颜色分布不均匀,软件无法识别

2.如果识别出来,大概率覆盖掉周围物体,很难修改

Vatic

Vatic是一个带有目标跟踪的半自动化视频标注工具,适合目标检测任务的标注工具。

网址: https://github.com/cvondrick/vatic/tree/contrib

标注类型

适合目标检测任务的视频标注

文件导出格式

JSON

亮点/优势

1.内含基于opencv的tracking,一段视频只需抽样标注,大大减少了工作量

2.支持接入亚马逊的众包平台Mechanical Turk,具体使用时,可以设定要标注的物体label,比如:水果,人,车,等等,然后指派任务给到众包平台

3.简洁使用的GUI界面,支持多种快捷键操作

不足

仅支持2D框标注。

03数据标注

数据是公认数字时代的石油。为了更好地对数据资源进行管理和开发利用,发挥数据资源的价值,国家已经开始并将进一步加快培育数据要素市场,发挥数据生产要素的作用,激活数据要素潜力,进一步完善数据生态,编制出台培育数据要素市场的指导性文件,数据标注行业,也将在快速发展的同时,更加规范化、制度化。

04人工智能实训项目

说到数据标注,那必须和大家再提一下我们的人工智能实训项目。

人工智能产业应用研究院对零基础学员有完善的实训课程和自主研发的在线数据标注平台,满足学员理论知识及实操技能的同步提升,使学员达到人工智能行业对人才要求的目的。

进入数据标注平台的方法非常简单:

第一步 关注微信公众号

第二步 点击菜单栏 “标注平台”

即可进入数据标注平台

微信公众号:云图智创人工智能产业应用研究院

05人工智能产业应用研究院

用场景定义AI·生态推进产业落地,以适应行业、产业结构,社会发展需求趋势和人才紧缺需求变化,打造集产教融合、产业应用人才培养、应用场景开发、产业生态培育、产业项目孵化创投于一体的国际化人工智能应用型产业培育基地。通过搭建人工智能产业链生态平台,推动人工智能技术形成应用于多元化业务场景的行业应用标准,以更完善的 AI产业链生态来促进和推动人工智能产业落地。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19503.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于JAVAEE的停车场管理系统(论文+PPT+源码

详情介绍 毕业设计(论文) 论文题目基于JAVAEE的停车场管理系统Thesis TopicJAVAEE – based parking management system 毕业设计(论文)任务书 毕业设计(论文)题目:基于JAVAEE的停车场管理系…

年轻人搞副业有多野:月薪4500,副业收入上万

前段时间,微博上有个热搜特别火,副业刚需。 意思是,在现在这个飞速发展的时代里,很多人觉得靠自己那点微薄的工资,很难养活自己;更是稍不留神,就被同龄人甩开一大截。 上面这张微博投票显示&…

基于51单片机的简易抢答器设计

【ChatGPT】前些天发现了一个巨牛的人工智能学习电子书,通俗易懂,风趣幽默,无广告,忍不住分享一下给大家。(点击查看学习资料) 基于51单片机的简易抢答器 具体功能: 1、主持人按下抢答开始按键…

电路基本知识

火线、零线、地线 L: live 火线 N: Neutral 中性 零线 PE : Protection Earthing 保护接地 PEN : Protection Earthing Neutral 保护中性线 火线零线和地线到底有什么区别?接地接到哪了?_哔哩哔哩_bilibili 家庭用电 工业用电 L1:R …

hnust 湖南科技大学 2023 软件测试技术 期中考试 复习资料

前言 写的比较匆忙,重点也不明确,没什么参考价值致谢:ly,zxq重点来源:信安※:补充内容★:重点✦:个人推测考点考试范围:1-9章获取最新版本 题型 判断:10简…

单片机开发---ESP32S3移植NES模拟器(二)

书接上文 《单片机开发—ESP32-S3模块上手》 《单片机开发—ESP32S3移植lvgl触摸屏》 《单片机开发—ESP32S3移植NES模拟器(一)》 暖场视频,小时候称这个为—超级曲线射门!!!!!&am…

开个帖子 记录刷题过程。

由于是转码 也深知代码能力的重要性 但之前断断续续的刷总觉得没什么长进 今天痛定思痛 决定开一个帖子 用来记录我的刷题过程 以此监督自己 。 2023.5.15 今天练习了贪心思想 目前我觉得比较关键的点是 排序 与 搞清楚贪心的对象。 455没有什么好说的 435需要明白 我们需要贪…

CTFshow web入门之信息收集(web1-web20)

信息搜集: 文章目录 信息搜集:web1:web2:web3:web4:web5:web6:web7:web8:web9:web10:web11:web12:web13&#…

chatgpt赋能python:Python主机发现——提高SEO效果的必备方法

Python 主机发现——提高SEO效果的必备方法 作为一名有10年python编程经验的工程师,我发现Python主机发现是一种非常有效的提高搜索引擎优化(SEO)效果的方法。虽然它可能会花费一些时间和精力,但是一旦你掌握了这个技能&#xff…

3DMax 卡死、白屏、渲染死机问题总结

白屏: 3dmax出现白屏解决方法 以下是ChatGPT给出的答案 内存不足:3DsMax需要大量的内存才能正常运行。如果你的计算机内存不足,3DsMax就会卡死。解决办法是升级你的计算机内存或者关闭一些不必要的程序来释放内存。 显卡驱动过时&#xff1…

世界杯——手动为梅西标名

梅西的铁粉来集赞啦。 今天带来了一个为图片添加字样的小功能,我们的测试目标图片是: 我们的测试目标是: 我们使用的是Python语言,使用了Image包用作图片处理,matplotlib包用作坐标查阅,这个坐标还是很好看…

不要对chatgpt过度反思 第二部分

如果未来,它真的可以引爆下一轮科技革命,只要双方不存在科技代差,就无法阻止科技扩散。 打个比方,如果你本身没有网络基础,没有大数据,她确实和你无关,反之,捅破了那层窗户纸&#x…

关于本次周总结

在本次的前端的学习中,虽然前端入门简单,但自己运用起来却有点小难度,尤其是自己做一个页面的时候,页面乱的让人疯狂,归根结底还是知识掌握的不扎实,没有得心应手的感觉用着没有丝滑感,我认真反…

独家 | ChatGPT提高你日常工作的五个特点以及如何使用它来提高代码质量

翻译:陈超 校对:赵茹萱本文约3200字,建议阅读8分钟 本文介绍了ChatGPT提高日常工作的五个特点。 ChatGPT已经完全改变了代码开发模式。然而,大多数软件开发者和数据专家们仍然不使用ChatGPT来完善——并简化他们的工作。 这就是我…

Python+chatGPT编程法力无边?

作为初学者,我们总是有一些不好意思问的问题。 现在我们可以尽情社恐,我们甚至可以向 ChatGPT 提出最低级的代码问题。 假设我们忘记了如何将两个字典合并。以下是 ChatGPT 可以如何帮助你的部分。 ChatGPT 还可以协助你进行更好的在线学习。假设你正在…

有了ChatGPT我还需要学习Python吗?

前言 ChatGPT是人工智能的产物,理解人类的思维,精通各种语言,能够辅助我们写代码,但是无法完全取代人类去编写代码。 首先,ChatGPT提供给我们一个思路去解决,它编写的代码不是完全正确的。如果我们不学习…

AutoGPT自主人工智能用法和使用案例

介绍 AutoGPT是什么:自主人工智能,不需要人为的干预,自己完成思考和决策【比如最近比较热门的用AutoGPT创业,做项目–>就是比较消耗token】 AI 自己上网、自己使用第三方工具、自己思考、自己操作你的电脑【就是操作你的电脑…

Python |浅谈爬虫的由来

本文概要 本篇文章主要介绍Python爬虫的由来以及过程,适合刚入门爬虫的同学,文中描述和代码示例很详细,干货满满,感兴趣的小伙伴快来一起学习吧! 🌟🌟🌟个人简介🌟&…

适合普通人的基金投资研究工具之:且慢与基金组合

当投资者在进行了充分的基金投资研究之后,如何开展投资实践就成了头等大事。从基金投资者具体的实践来看,很少会有投资者只选择单一基金进行长期投资,绝大多数的投资者都是在做基金组合投资。 (一)且慢与基金组合功能 …

杨立昆最新访谈:AI威胁论是蒙昧主义,控制欲只有人才有 (全文+视频)

作者:城主 | 编辑:腾讯新闻 郝博阳 编辑导语 经过了前一段时间的辛顿(Hinton)离职事件和AI监管大讨论之后,整个舆论界都在围绕着“AI毁灭人类的100种方法”大出文章。在这种众口一词的大合唱里,其实一直都有…