案例分享:基于预训练大模型的AI自动标注

从自动化时代到智能化时代,人工智能潜在的价值规模迅速扩张。如何将潜在的应用价值落到现实场景是摆在一众AI企业面前亟待破解的难题。

数据资源场景单一且有限、算力资源存在上限且成本高企、高端人才稀缺等问题无一不在阻碍AI产业的规模化商业落地。

而伴随着以ChatGPT为代表的大模型应用热潮的兴起,预训练大模型为解决上述问题提供了一条现实可行的技术路径,成为一张AI企业都想抓在手中的奔向“新世界”的船票。

相较于过往技术路径,预训练大模型可以大幅降低企业使用AI技术的门槛与成本,使应用场景从“单点专用”拓展到“点线面协同”,从而挖掘数据在行业应用中潜在的巨大价值。

从NLP到CV

提及大模型,就绕不开当前火热的ChatGPT。这款去年11月30日正式上线的应用迅速掀起新一轮AI应用热潮,其背后采用的Transformer模型更是成为学术界与产业界关注的焦点。

据悉,GPT采用的为主流Transformer模型,该模型使用自注意力机制,在NLP上表现优于RNN(循环神经网络)。在NLP方面,Transformer模型的自注意力机制可以为输入序列中的任意位置提供上下文,模型因此可以一次性处理所有输入数据。相较于RNN一次只能处理一个单词的情况,Transformer模型处理速度更快,可以大幅减少训练时间,并能够在更大规模的数据集上进行训练。目前,基于Transformer的预训练语言模型已成为NLP领域的主流。

事实上,大模型除了在NLP领域大放异彩外,其还可以应用在CV计算机视觉领域。计算机视觉常见的各类场景诸如图像识别、目标检测、语义分割、三维视觉等,也可以应用注意力机制,CV大模型(也称“大规模预训练计算机视觉模型”)应运而生,比较著名的是谷歌大脑在2020年推出的视觉Transformer(ViT)。

目前CV大模型主要应用领域包括图像识别、图像处理、视觉理解、视觉感知等多个方向,具体应用案例诸如利用2D图像序列生成3D场景,并在点云中检测目标等等。不过相较于NLP领域,CV大模型目前尚处于初步探索阶段。

基于预训练大模型的AI自动标注

自动驾驶主要以计算机视觉场景为主,其最大特点是场景复杂多变,这催生了应对海量数据处理与Corner Case问题的迫切需求,同时也推动了算法从专用小模型向通用大模型的快速演进。

算法开发需要面对海量数据以使自动驾驶系统更加安全可靠,这样的需求下,相较于传统小模型,大模型可以更好地处理大规模数据与高复杂度的任务。

作为行业领先的自动驾驶数据标注服务企业,曼孚科技始终关注前沿科技发展趋势,在大模型研发方面已持续投入多年,并成功应用在AI自动标注等领域。

相较于市面上存在的其他AI标注算法,曼孚科技AI预标注算法应用预训练大模型,具备较好的知识完备性,精度高,泛化能力强。

具体优势体现在:

1、大模型可以高效应对AI领域的任务Domain之间切换,在海量数据集上进行训练和优化,具有较好的知识完备性,精度高,泛化能力强;

2、大模型可以通过蒸馏、知识迁移等方法迅速提升下游任务小模型的能力,一般在下游任务中基于少量数据进行微调就可以获得较好的效果;

3、大模型可以通过自动标注等方法为小模型生产出更具有针对性的数据,供小模型学习,减少对下游任务数据标注成本的要求,减少开发和迭代成本;

4、大模型的Backbone(基础网络部分)一般可以使用无监督/自监督的方式在大规模的数据集上进行预训练;

5、大模型可融合多模态数据,能有效集成NLP、视觉、语音等源数据,实现1+ 1>2的效果,进一步提升AI模型的知识完备性。

当然,应用大模型也存在一些挑战:

1、大模型训练对于算力硬件的要求较高,对于AI框架的优化和高度并行计算能力有很大要求;

2、大模型的训练技术要求较高,例如如何设计训练策略、初始化参数、模型收敛等;

3、大模型一旦确定技术路线,后续切换模型成本较高等。

目前,曼孚科技预训练大模型在持续投入研发多年以后,已广泛应用于自动驾驶AI自动标注算法中,包括但不限于2D图像、3D点云等具体标注场景。

1、2D图像与视频交互式分割(通用场景):
在这里插入图片描述

2、2/3D融合自动标注

给定3D驾驶场景点云(连续帧序列)和对应的多视角Camera图像,对点云/Camera中的车辆、行人、道路标识等进行检测给出检测框,并针对运动物体给出运动信息预测:
在这里插入图片描述

上述基于预训练大模型的AI自动标注算法已应用于数个项目中。经过实际测算显示,相较于人工标注,AI自动标注可提效数倍至数十倍,同时大幅降低数据生产成本,满足自动驾驶落地应用对于海量高质数据的急迫需求。

未来,曼孚科技将继续专注于产品技术研发,持续完善基于预训练大模型的AI自动标注算法,提升场景适配度与精准度。在边标边训等更多技术辅助下,实现覆盖自动驾驶各细分标注场景,助力自动驾驶早日规模商用落地。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/30428.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI文本生成软件选哪个?看看这些软件推荐吧

最近几个月的时间内AI智能技术逐渐向大众开放,许多人都在使用AI智能进行一些创作 但是许多小伙伴依然不知道该如何使用AI来智能生成文本。那么大家想知道有哪些AI文本生成软件吗?看看下面几款大家常用的AI文本生成软件的介绍吧。 1.“AI写作宝” 软件介…

LLMs的自动化工具系统(HuggingGPT、AutoGPT、WebGPT、WebCPM)

在前面两篇博文中已经粗略介绍了增强语言模型和Tool Learning,本篇文章看四篇代表性的自动化框架,HuggingGPT、AutoGPT、WebGPT、WebCPM。 Augmented Language Models(增强语言模型)Toolformer and Tool Learning(LLM…

代码恐怖故事:隐藏在复杂代码库中的恐怖秘密

本文讲述了开发者们在复杂代码库中工作的经历和教训,包括代码复杂性带来的问题、架构决策、第三方库引发的意外问题以及令人恐慌的编程错误,以及如何处理这些挑战。 原文链接:https://digma.ai/blog/coding-horrors-tales-of-codebase-comple…

【ChatGPT助我开发】利用ChatGPT编写基于Matlab的SVM的蔬菜分类项目

序言 从去年12月份开始用ChatGPT,一直被惊艳到,然后问一些奇怪的问题,到现在助力开发,我发现合适的提示词(Prompt)会很大程度影响到生成的质量,我在开发的过程中也会逐渐完善修改,最…

matlab绘图常用函数及代码

1、绘图:plot /semilogy /loglog /scatter figure(1); subplot(1,2,1);%子图 axis([0 10 10^-5 10^-1]);%限制作图范围,x轴0~10,y轴10^-5到10^-1 plot(X,Y,Color,[R G B],LineStyle,-,Marker,o,LineWidth,1); hold on; grid on;%显示网格 &…

HR怀疑程序员简历造假,随后的做法引起网友热议:过分了

简历可以说是求职过程中最重要的一份材料,因此不少人对简历都精心准备,以便全面地展示自己。对企业来说,简历最重要的一点便是真实。可以说所有公司对简历造假都是保持零容忍的态度。最近,一位HR网友在职场社区分享了他怀疑程序员…

程序员简历优化之道

作者:安晓辉 声明:原创文章,禁止各种形式的转载。 为什么你投十份简历,只有一两家公司约你?又或者为什么你每投一份简历都能获得面试机会? 最根本的原因,就是一方在汲汲渴求,而恰恰…

别再胡乱写简历了,一份适合普通大众的简历模版,送给大家

今天我们就来聊一聊在校招时,简历该如何写的问题。说实话,对于简历的书写方式,可能不同的人会有不同的见解,并且不同的面试官/HR在筛选的时候也会有所差异,所以在我看来,不存在一种绝对稳的简历模版。 我在…

聊求职:写简历的大原则与小技巧

简历,是求职者向未来雇主展示专业技能和职业素养的自我推销工具,是赢得面试机会的敲门砖。如果没有面试邀约,大多只有两种可能:要么是简历写的太屎了,要么是简历投的太屎了。所以,当没有面试机会的时候&…

用 Markdown 写炫酷简历,助力跳槽换工作

大家好我是徐小夕。 今天给大家来介绍一个简历制作神器,是我的朋友秋风开发的。这个项目是一款免费在线简历制作工具,通过将书写的Markdown 和选择的主题快速转化不同风格的简历, 同时还可以一键复用其他人做的优秀的简历, 助力求职者快速制作精美的简历…

分享162个助理类简历模板,总有一款适合您

分享1626个助理类简历模板,总有一款适合您 162个助理类简历模板下载链接:https://pan.baidu.com/s/1Uy3eXPz9D-wK-l7z3KDIWQ?pwdl139 提取码:l139 Python采集代码下载链接:采集代码.zip - 蓝奏云 class ChinaZJsSelenium:ba…

掌握这些写简历投简历的“黑魔法”,告别简历已读不回!

“哎,我还能找到工作吗?” 这是最近加我微信的好友,问的最多的一句话。 太卷了 最近加我微信的朋友很多,我都很奇怪,最近也没怎么发文章,怎么会有这么多人加我。 大概就是因为太卷了,之前写的…

简历优化实战案例01:工作经历篇

大家好,我是小谭。 最近,我在帮一位求职者修改简历时,发现一些求职者常犯的简历错误。在征得求职者同意后,我粘出来,同大家分享和交流,期望通过此分享,让大家了解写简历的常见坑和注意点。 本…

分享111个助理类简历模板,总有一款适合您

分享111个助理类简历模板,总有一款适合您 111个助理类简历模板下载链接:https://pan.baidu.com/s/1JafYuLPQMmq37K4V0wiqWA?pwd8y54 提取码:8y54 Python采集代码下载链接:https://wwgn.lanzoul.com/iKGwb0kye3wj 设计师助理…

找工作的程序员应该这样优化简历【内附120套优质简历模板】

《花千骨》一剧,白子画为什么收花千骨为徒? 《琅琊榜》中,梅长苏为什么选靖王而弃太子、誉王? 《泰坦尼克号》里,杰克和露丝为什么会一见钟情? 王子基特为什么会选择灰姑娘辛德瑞拉? 这些问题乍…

易语言易语言浏览器html5,易语言创建的浏览器源码

易语言创建的浏览器源码系统结构:事件_编辑框1_获得焦点,事件_选择夹1_鼠标右键按下,子程序_删除页面,事件_窗口1_尺寸被改变,事件_选择夹1_子夹被改变,子程序_添加页面,事件_浏览器_即将跳转,事件_浏览器_即将打开新窗口3,事件_浏览器_标题被改变,事件_编辑框1_按下某键,SkinH…

易语言 普通填表 html5,易语言网页填表源码

易语言网页填表源码系统结构:passport_tianya,passport_xinlang,passport_baidu,Automatic_modification,Insert_text,Loadconfiguration, 窗口程序集1 || ||------_按钮8_被单击 || ||------_按钮11_被单击 || ||------passport_tianya || ||------passport_xinlang || ||----…

易语言启动局域网计算机程序,易语言局域网计算机监控源码

易语言局域网计算机监控源码系统结构:取计算机列表,弹出提示窗,上下线, 窗口程序集1 || ||------__启动窗口_创建完毕 || ||------取计算机列表 || ||------_选择框1_被单击 || ||------_时钟1_周期事件 || ||------_按钮1_被单击 || ||------_按钮2_被单击 || ||------__启动窗…

易语言在线播放器源码php,易语言视频播放器源代码

用简单的语言编写视频播放器的源代码 源代码包含以下功能: *调用Thunder APlayer SDK进行视频播放*自动检测是否下载Thunderbolt解码库,如果不存在,则自动下载并解压缩(新手可以学习)新手可以学习)*支持快捷键可快进和快退以及将音量最多增加或减小至1000 *自动截取本地视频缩…

易语言PHP自动更新,易语言自动更新源码

作为软件制作者,很多时候,我们都需要自动更新来约束软件使用者。尽管有些人不愿意更新,但是长久使用老版本毕竟不是长久之策。小编这里给大家带来易语言自动更新的源码模块,放入你的软件中正合适,需要的话就来试试吧&a…