【大模型】人工智能大模型在自动驾驶领域的应用

在这里插入图片描述

随着ChatGPT的火爆,大模型受到的关注度越来越高,大模型展现出的能力令人惊叹。

  • 第一个问题:怎样的模型可以称之为大模型呢?

    • 一般来说,我们认为参数量过亿的模型都可以称之为“大模型”。而在自动驾驶领域,大模型主要有两种含义:一种是参数量过亿的模型;另一种是由多个小模型叠加在一起组成的模型,虽然参数量不过亿,但也被称为“大模型”。
  • 第二个问题:大模型的应用有什么条件?

    • 大数据和大算力是大模型应用的重要前置条件。
    • 数据方面,根据毫末智行 CEO 顾潍颢在毫末 AI DAY 上表示,训练出一个能输出高精度和准确度的自动驾驶大模型,自动驾驶测试里程数据需至少达到 1 亿公里;
    • 算力方面:超算中心成为自动驾驶厂商重要的基础设施,特斯拉Al计算中心Dojo总计使用了1.4万个英伟达的GPU 来训练AI模型,网络训练速度提升30%。国内厂商中小鹏与阿里联合出资打造自动驾驶AI智算中心“扶摇”,将自动驾驶算法的模型训练时间提速170倍。

在这里插入图片描述

1. 大模型在云端的应用

1.1 数据自动标注

  • 采用大模型预训练的方式可以实现自动标注,自动标注工具可大幅提升数据处理速度。模型的标注精度相对越高,对人的替代程度相应也越高。

  • 一般来说,大家对标注任务的期望主要包括标注过程的效率高、标注结果的精确程度高以及一致性高。效率高和精确度高都很容易理解,一致性高是指什么呢?在3D识别的BEV算法中,工程师要采用激光雷达加视觉的联合标注,需要联合处理点云和图像数据。在这种处理环节里面,工程师可能还会需要在时序层面上做一些标注,那么前后帧的结果就不能区别太大。

  • 小鹏推出的全自动标注系统将效率提升近 45,000 倍,以前 2,000 人年的标注量,现在 16.7 天可以完成。毫末智行在 AI Day 中表示毫末基于视觉自监督大模型,实现 4D Clip 的 100%自动标注,原先依靠的人工标注成本则降低 98%。
    在这里插入图片描述

  • 2018 年至今,特斯拉数据标注经历了 4 个发展阶段:1)第 1 阶段(2018 年之前):只有纯人工的 2 维的图像标注,效率较低;2)第 2 阶段(2019):人工进行3D 固定框的图像标注;3)第 3 阶段(2020):采用 BEV 空间进行标注;4)第 4 阶段(2021):首先对场景进行重建后在 4D 空间中进行标注,精度、效率都得到大幅提升。特斯拉自动标注系统可以取代 500 万小时的人工作业量,人工仅需要检查补漏。
    在这里插入图片描述

1.2 数据挖掘

  • 大模型有较强的泛化性,适合用于对长尾数据的挖掘。城市场景下道路及路况复杂(红绿灯路口)、交通参与者多(行人、低速两轮车)、场景异质性强(不同城市甚至不同路段路况差异性大),自动驾驶遇到的 Corner case 大幅提升。
    在这里插入图片描述

  • 假如采用传统的基于标签的方式来挖掘长尾场景,模型一般只能分辨已知的图像类别。2021年,OpenAI发布了CLIP模型(一种文字——图像多模态模型,可以在无监督预训练之后将文本和图像对应,从而基于文本对图片进行分类,而非只能依赖于图片的标签),我们也可以采用这样的文字-图像多模态模型,用文字描述来检索行驶过程中的图像数据。例如,‘拖着货物的工程车辆’、‘两个灯泡同时亮着的红绿灯’等长尾场景。
    在这里插入图片描述

1.3 用知识蒸馏的方式“教”小模型

  • 大模型还可以采用知识蒸馏的方式“教”小模型。

  • 何为知识蒸馏呢?用最通俗的话来解释,就是大模型先从数据中学到一些知识,或者说提取到一些信息,然后再用学到的知识“教”小模型。在实践中,可以先把需要打标签的图片给大模型学习,大模型可以给这些图片打好标签,如此一来,我们就有了标注好的图片,将这些图片拿来训练小模型,就是一种最简单的知识蒸馏方式。当然了,我们也可以采用更复杂的方式,如先用大模型从海量数据中提取特征,这些提取出来的特征可以用来训练小模型。

1.5 自动驾驶场景的重建和数据生成

  • 除了真实场景数据外,仿真场景是弥补训练大模型数据不足问题的重要解决方式。仿真场景通常由虚拟引擎构建,通过把构建的场景导出为虚拟标注数据集,并且在数据集中加入传感器噪声及增加雨雪等恶劣天气干扰因素后,可以用于感知训练数据增强,极大的丰富了训练数。
    在这里插入图片描述
    在这里插入图片描述

  • 图森中国借助近两年来迅猛发展的神经渲染(Neural Rendering)技术,试图全部从真实的路测数据中重建世界与车辆,并按需修改我们关心的其他车辆的行为。这样能够最大限度保障模型在实际部署与仿真测试之间的一致性。我们可以通过改变视角、改变光照、改变纹理材质的方法来生成各种高真实感数据,例如通过视角变化可以模拟变道、绕行、调头等各种主车行为,甚至模拟一些即将碰撞的高危险性场景数据。

  • 链接: 基于神经渲染的下一代真实感仿真

  • 生成式 AI 有望推动仿真场景大幅提升泛化能力,帮助主机厂提升仿真场景数据的应用比例,从而提高自动驾驶模型的迭代速度、缩短开发周期。当前仿真场景对实际路测中所遇到的边缘案例主要通过人工进行泛化,如量产车在影子模式下遇到某一个 corner case 并进行数据回传后,在虚拟引擎中进行场景重建,再通过人为添加要素,如增添雨雾环境、增加交通参与人数等方式对原始场景进行梯度泛化。但对场景的泛化能力依赖于工程师对于场景的理解,且存在经由手动添加元素后的场景与真实场景的拟合度不高的问题。生成式 AI有望在针对真实场景中的 corner case 进行场景泛化的过程中取代人工,可以迅速泛化出大量的、与真实世界高拟合度的虚拟场景,进而提高自动驾驶模型的迭代速度。
    在这里插入图片描述

  • 下一篇我们来讲 大模型在车端的应用

请关注博主,一起玩转人工智能及深度学习。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17480.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高二学生爆肝10个月!自学数电在《我的世界》里打造理论最快计算器,5天涨粉1万...

金磊 梦晨 发自 凹非寺量子位 报道 | 公众号 QbitAI 辛丑牛年(2021),《我的世界》,一高二学生因爆肝在B站火了。 他从未接触过数电,一切从零开始,仅仅是为了搞清计算器的原理。 然后……然后…… 就直接在《…

浅谈图像生成模型 Diffusion Model 原理

重磅推荐专栏: 《AI 大模型之美》 揭开 ChatGPT 面纱,拥抱 AI 新潮流 重磅推荐专栏: 《Transformers自然语言处理系列教程》 手把手带你深入实践Transformers,轻松构建属于自己的NLP智能应用! 可不可以先 点击下方链接…

3纳米M3首发iMac/ 台积电拟招聘6千人/ 小鹏人脸识别需对车头半跪…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是3月6日星期一,又是元气满满的一周。 新一周的开始,一起来和日报君看看最近科技圈都有哪些新鲜事吧~ 台积电今年计划招聘6000余人 年前各大科技公司都在裁员来应对行业挑战…

追溯ChatGPT

ChatGPT 国内趋势 在国际学术界看来,ChatGPT / GPT-3.5 是一种划时代的产物 它与之前常见的语言模型 (Bert/ Bart/ T5) 的区别,几乎是导弹与弓箭的区别,一定要引起最高程度的重视 国际上的主流学术机构 (如斯坦福大学,伯克利加…

【Go】集成paypal支付接口

go 语言集成paypal支付接口 PayPal 是一种常用的在线支付服务。如果要在 Go 语言项目中使用 PayPal 支付接口,您需要使用 PayPal 提供的 API。下面是 Go 语言中如何集成 PayPal 支付接口的一些基本步骤: 注册 PayPal 帐户:如果您没有 PayPa…

【WhatsApp营销】不可错过的品牌WhatsApp创意营销案例分享

关键词:WhatsApp营销,营销案例 作为社交网络社区,WhatsApp拥有高开放率和超过20亿的用户规模,如何在该平台上开展营销活动,利用该平台进行商业行为是越来越多的品牌正在做的事。一些大品牌一直在有效地做到这一点&…

微信模板信息发送给用户(JAVA)

微信模板信息 为了保证用户不受到骚扰,在开发者出现需要主动提醒、通知用户时,才允许开发者在公众平台网站中模板消息库中选择模板,选择后获得模板ID,再根据模板ID向用户主动推送提醒、通知消息。 获取微信凭证 这一步我在另一篇…

java微信模板消息接口的使用

通过之前的微信开发分享我们应该知道微信如果要给用户主动发送消息可以使用客服消息或多客服,但是发送客服消息用户需在48小时内和微信公众号有过交互,也就是说如果48小时内用户没和公众号交互过,即使发了客服消息用户也可能接不到。除了上面…

重磅发布!微软推出首款 ChatGPT 版搜索引擎!

机器之心报道 机器之心编辑部 从现在起,比 ChatGPT 更强大的语言模型直接进入了你的浏览器。 一夜之间,全球最大的科技公司仿佛都回到了自己年轻时的样子。 在谷歌宣布「实验性对话式人工智能服务」Bard 之后仅 24 小时,北京时间 2 月 8 日凌…

Prompt 编写模式:如何将思维框架赋予机器,以设计模式的形式来思考 prompt

作者 | 黄峰达 责编 | 王子彧 出品 | Phodal(ID:phodal) 如何理解 Prompt ? prompt 通常指的是一个输入的文本段落或短语,作为生成模型输出的起点或引导。prompt 可以是一个问题、一段文字描述、一段对话或任何形式…

GPT-4刚刚接入Office全家桶!微软:重新发明生产力!

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【计算机视觉】微信技术交流群 梦晨 丰色 发自 凹非寺转载自:量子位(QbitAI) 一觉醒来,工作的方式被彻底改变。 微软把AI神器G…

万字干货!ChatGPT 从零完全上手实操指南!【一】

ChatGPT 的横空出世,让很多人焦虑不已,不过,你完全不需要为此焦虑,因为比 AI 更强大永远是驾驭 AI 为自己所用的人类。 而且 GPT 远没有各大商家炒作的那么玄乎,它应用逻辑也非常简单,你完全没必要为此去花…

ChatGPT给总统写演讲稿,骗过现场2万听众

丰色 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT的火,已经蔓延到总统级别的人物身上了—— 就在这两天,以色列总统使用ChatGPT生成的内容,在一场技术会议上公开发表了一段致辞。 现场一共约2万名听众,一开始都被“蒙在鼓里”&…

GPT-4 终问世!旧王已死,新王当立!面对AI,人类真的准备好了吗?

GPT-4 终问世!旧王已死,新王当立!面对AI,人类真的准备好了吗? 摊主一大早醒来,就看见 GPT-4 发布的消息,不得不感慨今年 AI 更新的速度真是太快了。🚀 摊主昨天还在修改、润色自己一…

linux:用户修改密码方法

今天终于拿到心心念念的服务器账号了,拿到密码的同时被告知需要改密码,输入passwd后,得到如下结果: passwd: Authentication token manipulation error 按照搜到的方法,做出如下解决: 一、首先lsattr /etc…

Ubuntu 修改用户密码方法详解

修改个人密码&#xff1a; 方法1: 在终端运行 usrnameusrname-laptoppasswd:~$passwd usrname 改变口令为 usrname。 &#xff08;当前&#xff09;UNIX 口令&#xff1a;<输入现在的密码> 输入新的 UNIX 口令&#xff1a; <输入新密码> 重新输入新的 UNIX 口…

postgresql修改密码

前言&#xff1a; PostgreSQL使用存储在数据库数据目录中的pg_hba.conf配置文件来控制客户端的连接认证参数。 -将该值设置为“trust”意味着您可以以postgres的身份登录&#xff0c;而无需输入密码。 -将值设置为“md5”的默认值意味着您应使用密码以postgres身份登录 步骤&…

如何在 Linux 中使用 Chage 命令,修改Linux系统用户密码更改策略

Chage是一个用于修改Linux系统用户密码更改策略的命令行工具。在本文中&#xff0c;我们将介绍如何在Linux系统中使用Chage命令。 检查用户密码过期信息 使用Chage命令可以检查用户密码更改策略和过期信息。要检查特定用户的密码过期信息&#xff0c;可以使用以下命令&#x…

PostgreSQL 修改用户密码

以postgres用户执行psql连接数据库&#xff1a; alter user postgres with encrypted password PGsql123; 以postgres用户执行psql连接数据库&#xff1a; \password 查看PG的版本信息&#xff1a; select version(); 查看PG的系统表&#xff1a; select * from pg_tables…

用户修改密码

用户-修改密码-持久层 1.1 规划需要执行的SQL语句 用户修改密码时需要执行的SQL语句大致是&#xff1a; update t_user set password ?,modified_user?,modified_time? where uid?在执行修改密码之前&#xff0c;还应检查用户数据是否存在、并检查用户数据是否被标记为…