【笔记】自动驾驶预测与决策规划_Part1_自动驾驶决策规划简介

自动驾驶决策规划简介

    • 0、前言
    • 1、自动驾驶概述
      • 1.1 预测(Prediction)
      • 1.2 决策(Decision Making)
      • 1.3 规划(Planning)
    • 2、自动驾驶历史和背景
    • 3、自动驾驶级别和分类
    • 4、预测决策规划的重要性
      • 4.1 预测的重要性
      • 4.2 被遮挡的车辆(occluded agents)的处理
        • 1. 基于感知的预测(Perception-Based Prediction)
        • 2. 基于运动的预测(Motion-Based Prediction)
        • 3. 概率图模型与多目标跟踪(Probabilistic Graph Models & Multi-Object Tracking)
        • 4. 基于仿真与训练的模型
        • 5. 相关论文:
      • 4.3 决策规划的重要性
      • 4.4 预测经典方案:
      • 4.5 决策的经典方案
      • 4.6 规划的经典方案

0、前言

本文主要记录课程《自动驾驶预测与决策技术》的学习过程,难免会有很多纰漏,感谢指正。
课程链接:https://www.shenlanxueyuan.com/my/course/700 在这里插入图片描述

1、自动驾驶概述

image.png

  • Ding W, Zhang L, Chen J, et al. Epsilon: An efficient planning system for automated vehicles in highly interactive environments[J]. IEEE Transactions on Robotics, 2021, 38(2): 1118-1138.
    image.png
    在这里插入图片描述
    image.png
    在这里插入图片描述

什么是自动驾驶的预测、决策和规划?

在自动驾驶系统中,预测、决策和规划是三个关键组件,它们共同作用以实现车辆在复杂动态环境中的自主行驶。以下是对这三个组件的详细解释:

1.1 预测(Prediction)

定义:预测模块的任务是预估周围环境中其他交通参与者(如车辆、行人、自行车等)的未来行为和轨迹。
功能

  • 行为预测:基于当前状态和历史数据,预测其他交通参与者的可能行为(如加速、减速、转弯)。
  • 轨迹预测:生成其他车辆或行人在未来一段时间内的运动轨迹。

不确定性处理:由于未来行为具有不确定性,预测模型通常会生成多个可能的轨迹,并评估其概率。

  • 基于规则的方法:使用预定义的规则和模型,如物理运动模型。
  • 机器学习方法:使用历史数据训练的机器学习模型,如神经网络,进行行为和轨迹预测。

1.2 决策(Decision Making)

定义:决策模块负责基于预测模块提供的信息,制定出车辆的高层次行为策略,以确保安全、高效的驾驶。

功能:

  • 风险评估:评估不同驾驶策略的风险,包括与其他交通参与者的潜在碰撞风险。

  • 策略选择:在多个候选策略中选择最优的一个。例如,选择是否变道、是否减速等。

  • 情景响应:根据交通法规和实时交通状况,做出合理的驾驶决策。

方法:

  • 规则基方法:基于预定义的规则和条件进行决策。
  • 基于优化的方法:使用优化算法在多个候选策略中寻找最优解。
  • 机器学习方法:训练智能体通过模拟和强化学习方法进行决策。

1.3 规划(Planning)

定义:规划模块将决策模块的高层次行为策略转化为具体的车辆运动轨迹和控制命令。

功能

  • 路径规划:生成从当前点到目标点的可行路径,确保路径的平滑性和安全性。

  • 运动规划:根据路径规划,生成具体的速度和转向控制命令,控制车辆运动。

  • 动态调整:实时调整路径和运动规划,适应动态环境和实时交通状况。

方法:

  • 几何规划:使用几何方法生成路径,如A*算法、Dijkstra算法。

  • 优化规划:使用优化算法生成平滑且符合车辆动力学约束的轨迹,如梯度下降、二次规划。

  • 行为树:使用行为树模型,根据不同场景生成对应的路径和控制策略。

示例

在实际应用中,这些模块协同工作,确保自动驾驶车辆能够安全、高效地行驶。例如,当车辆在高速公路上行驶时:

  1. 预测:预测前方车辆的轨迹,判断其是否可能减速或变道。

  2. 决策:根据预测结果,判断是否需要变道超车或减速跟随,并选择最优策略。

  3. 规划:生成平滑的变道轨迹和加速/减速命令,并实时调整以应对突发情况。

参考文献

  • [A Survey of Motion Planning and Control Techniques for Self-driving Urban Vehicles](https://ieeexplore.ieee.org/document/8302432)

  • [Deep Learning for Self-Driving Cars: Chances and Challenges](https://arxiv.org/abs/2006.06094)

  • [Autonomous Vehicles: From Perception to Decision-Making](https://arxiv.org/abs/2010.01929)

2、自动驾驶历史和背景

image.png

image.png
image.png
image.png
image.png
image.png
image.png

3、自动驾驶级别和分类

image.png自动驾驶系统组成
在这里插入图片描述

4、预测决策规划的重要性

4.1 预测的重要性

image.png

轨迹预测的重要性

  • 轨迹预测涉及对周围交通参与者(如其他车辆、行人)的未来运动路径进行预测。左图中,可以看到自动驾驶系统正在预测前方车辆的可能行驶轨迹。能够提前判断其他交通参与者的行为,例如是否可能变道、加速、或减速。

  • 通过准确的轨迹预测,自动驾驶系统可以在复杂的交通环境中做出更明智的决策,如调整自身的行驶路径、速度,或者进行紧急规避,从而避免潜在的事故。

占用预测的重要性

  • 占用预测是自动驾驶系统通过感知周围环境来预测道路区域的未来占用情况。这种预测对于理解视野外或被遮挡物体的行为尤为关键。例如,在交叉路口中,系统可能无法直接看到某些车辆,但通过占用预测,系统可以合理推测这些隐藏车辆的未来位置,进而避免碰撞或其他意外。

预测在决策中的作用

  • 预测作为输入,为系统的决策制定和运动规划提供了关键的上下文信息。结合预测结果,自动驾驶系统能够根据其他交通参与者的未来行为进行智能决策。这种决策并不仅仅是基于当前状态,而是基于未来一段时间内可能发生的变化,这使得自动驾驶系统能够提前应对复杂的交通场景,提高反应速度和安全性。

系统鲁棒性与安全性

  • 通过多模态感知和智能预测,自动驾驶系统可以处理更多复杂的情况。例如,系统可以处理被遮挡的车辆(occluded agents),预测它们的行为并做出相应的反应。这显著提高了系统的鲁棒性和安全性,特别是在复杂的城市环境或拥挤的交通场景中。

4.2 被遮挡的车辆(occluded agents)的处理

1. 基于感知的预测(Perception-Based Prediction)
  • 多传感器融合:通过融合激光雷达、摄像头和雷达等不同传感器的数据,可以提高检测和跟踪遮挡物体的能力。例如,如果摄像头视野被遮挡,雷达或激光雷达可能仍然能够探测到隐藏在障碍物后方的车辆。
  • 场景上下文推理:基于环境中的上下文信息(如地图、交通规则、其他已知的交通参与者行为模式),系统可以推测被遮挡物体的存在及其可能行为。例如在交叉路口,通过观察其他车辆的运动轨迹,可以推测出可能有隐藏车辆的存在。
  • 卷积神经网络(CNNs)与生成模型:这些模型可以用于预测被遮挡区域内可能存在的物体及其行为。生成模型(如GANs)能够帮助自动驾驶系统推测出遮挡区域内物体的潜在位置和运动轨迹。
2. 基于运动的预测(Motion-Based Prediction)
  • 基于历史运动数据的推断:系统可以基于历史的运动数据和轨迹来推断当前被遮挡车辆的位置。例如,利用贝叶斯滤波器、卡尔曼滤波器等经典方法来对被遮挡的物体进行轨迹预测。
  • 行为模型与意图预测:一些方法通过对交通参与者的行为建模,预测其未来的意图。例如,基于过去的运动轨迹,可以推测出遮挡的车辆是保持直行还是准备转向。
3. 概率图模型与多目标跟踪(Probabilistic Graph Models & Multi-Object Tracking)
  • 贝叶斯网络与马尔可夫决策过程(MDPs):这些方法能够为被遮挡的车辆建立概率模型,并通过模拟不同的场景与事件来推测出遮挡物体的行为。该方法可以计算出遮挡物体的可能分布和位置。
  • 多目标跟踪(MOT):通过联合跟踪可见和不可见的目标,系统可以保持对遮挡物体的持续跟踪。常见的技术包括联合数据关联算法、置信度传播模型等。
4. 基于仿真与训练的模型
  • 数据增强与仿真训练:自动驾驶系统通常会在模拟环境中训练对被遮挡物体的检测和推测能力。在这些模拟中,系统通过生成不同遮挡场景来学习如何处理被遮挡的物体。
  • 端到端深度学习模型:这些模型能够在训练过程中学习如何应对被遮挡的物体,通过大规模数据和仿真场景训练,增强对被遮挡物体的感知和预测能力。
5. 相关论文:
  • Occlusion-aware Object Detection and Tracking in Urban Scenes (https://ieeexplore.ieee.org/document/7963801)
  • Learning to Predict Vehicle Trajectories with Model-Based Planning (https://arxiv.org/abs/1810.04015)
  • Occupancy Flow: Joint Occupancy and Motion Learning for Autonomous Driving (https://arxiv.org/abs/2203.17272)
  • Scene Understanding for Autonomous Driving in Adverse Weather Conditions using Depth Estimation (https://ieeexplore.ieee.org/document/8917876)
  • A Probabilistic Framework for Occluded Object Reasoning in Vision-Based Autonomous Driving (https://arxiv.org/abs/2004.03044)

4.3 决策规划的重要性

image.png

4.4 预测经典方案:

image.png

image.png

image.png
image.png

  • Shi S, Jiang L, Dai D, et al. Motion transformer with global intention localization and local movement refinement[J]. Advances in Neural Information Processing Systems, 2022, 35: 6531-6543.

4.5 决策的经典方案

image.png

4.6 规划的经典方案

image.png

image.png
在这里插入图片描述

  • Hu Y, Yang J, Chen L, et al. Planning-oriented autonomous driving[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2023: 17853-17862.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/421902.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从OracleCloudWorld和财报看Oracle的转变

2024年9月9-12日Oracle Cloud World在美国拉斯维加斯盛大开幕 押注AI和云 Oracle 创始人Larry Ellison做了对Oracle战略和未来愿景的主旨演讲,在演讲中Larry将AI技术和云战略推到了前所未有的高度,从新的Oracle 23c改名到Oracle23ai,到Oracl…

性能测试-jmeter脚本录制(十五)

一、jmeter脚本录制(不推荐)简介: 二、jmeter脚本录制步骤 1、添加代理服务器和线程组 2、配置http代理服务器的端口和目标线程组 3修改本机浏览器代理 4、点击启动 5、每次操作页面前,修改提示文字

如何删除电脑系统桌面文件右键菜单多余选项

你可能会遇到以下情况,电脑鼠标右键有较多无用的菜单选项,或者安装某个程序卸载后,右键菜单仍有相关的选项。下面小编就来和大家分享电脑桌面右键菜多余选项删除方法,适用于win7、win10、win11等windows系统。 举例说明&#xff…

NVIDIA AI Workbench 让 Windows 上的 GPU 使用更加简便

NVIDIA AI Workbench 是一款免费的、用户友好型开发环境管理器,可在您选择的系统(PC、工作站、数据中心或云)上简化数据科学、ML 和 AI 项目。在 Windows、macOS 和 Ubuntu 上,您可以本地开发、测试项目和构建项目原型&#xff0c…

vue2实践:el-table实现由用户自己添加删除行数的动态表格

需求 项目中需要提供一个动态表单,如图: 当我点击添加时,便添加一行;点击右边的删除时,便删除这一行。 至少要有一行数据,但是没有上限。 思路 这种每一行的数据固定,但是不定行数的&#x…

信刻光盘安全隔离与信息交换系统

随着各种数据传输、储存技术、信息技术的快速发展,保护信息安全是重中之重。军工、政府、部队及企事业单位等利用A网与B网开展相关工作已成为不可逆转的趋势。针对于业务需要与保密规范相关要求,涉及重要秘密信息,需做到安全的物理隔离&#…

PHP实时统计结果秒出高效能在线投票工具系统小程序源码

实时统计,结果秒出 —— 体验高效能在线投票工具系统 🚀 投票新纪元,效率为王! 在这个快节奏的时代,每一秒都至关重要。你是否厌倦了传统投票方式中漫长的等待和繁琐的统计过程?那么,就让我带你…

数字乡村网络文化服务平台建设方案

1. 平台建设背景与目标 数字乡村网络文化服务平台的建设旨在通过数字化手段整合乡村内外资源,打造全面覆盖、精准服务的乡村服务体系,以改善民生和促进社会稳定。平台包括居民管理、互动交流、服务管理等五大应用,实现乡村服务的多元化、精确…

Mac在Python项目中通过opencv模版匹配定位不到图片

起因 原本一行代码的事情,但是在Mac上总能出现意外,如下 box pyautogui.locateOnScreen(obsidian.png) print(box) pyautogui.moveTo(box[0],box[1])上面的代码用来定位图片在屏幕中的位置,然后移动鼠标到定位到的屏幕位置坐标。 意外…

实战OpenCV之像素操作

基础入门 在OpenCV中,像素是最基本的操作单位。图像可以视为一个三维数组,其中第三维表示颜色通道。图像数据在内存中以连续或几乎连续的方式存储,对于多通道图像(比如:BGR图像),每个像素的各通…

EmguCV学习笔记 VB.Net 11.5 目标检测

版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。 EmguCV是一个基于OpenCV的开源免费的跨平台计算机视觉库,它向C#和VB.NET开发者提供了OpenCV库的大部分功能。 教程VB.net版本请访问…

初识时序数据库InfluxDB

最近项目开发中,需要记录时间序列的日志信息,InfluxDB 刚好契合。于是准备研究一下,发现已经有整理很好的文档,以下两篇觉得很好,入门开发可以参考一下。 因为项目是用C#开发的,因此,简单介绍一下C#开发中,InfluxDB的API使用。 1.简介 InfluxDB是一个由InfluxData开发…

《食品安全导刊》是什么级别的期刊?是正规期刊吗?能评职称吗?

问题解答 问:《食品安全导刊》是不是核心期刊? 答:不是,是知网收录的正规学术期刊。 问:《食品安全导刊》级别? 答:国家级。主管单位: 中国商业联合会 主办单…

ONLYOFFICE8.0部署集成(vue+java)并配置存储为minio

文章目录 前言一、使用docker安装onlyoffice8安装使用DockerDesktop方式命令行方式使用 HTTPS 运行展示 二、项目集成前端集成-vue3html方式后端集成-java 三、onlyoffice基础原理四、配置存储为minio1.onlyoffice配置文件挂载问题2.配置存储为minio3.验证切换minio存储是否生效…

生成式AI介绍

生成式AI介绍 生成式AI(Generative AI)是人工智能领域的一种技术,能够通过学习现有数据来生成新的内容。不同于传统的人工智能模型只进行分类、回归等分析任务,生成式AI具备创作能力,能够生成文本、图像、音频甚至视频…

基于spring拦截器实现博客项目的强制登录功能(四)

6. 强制登录 当⽤⼾访问 博客列表和博客详情⻚ 时, 如果⽤⼾当前尚未登陆, 就⾃动跳转到登陆⻚⾯. 我们可以采⽤拦截器来完成, token通常由前端放在header中, 我们从header中获取token, 并校验 token是否合法 6.1 添加拦截器 package com.example.spring_blog_24_9_8.config;…

性能测试-jmeter的控制器(十六)

一、if控制器 需求:使用“用户自定义变量”定义name变量,值可以是“baidu”或“itcast”,使用变量值,控制是否访问对应网站。 1、步骤: 在测试计划中添加用户定义的变量name,取值可为baidu或itcast添加两个http请求&#xff1a…

misc音频隐写

一、MP3隐写 (1)题解:下载附件之后是一个mp3的音频文件;并且题目提示keysyclovergeek;所以直接使用MP3stego对音频文件进行解密;mp3stego工具是音频数据分析与隐写工具 (2)mp3stego工具的使用:…

CSS实现前端布局更巧妙的方案!在 flex 布局中通过使用 margin 实现水平垂直居中以及其他常见的前端布局

在前端开发中,实现水平垂直居中一直是个热门话题。随着 CSS Flexbox 布局的普及,开发者们开始更多地使用 justify-content 和 align-items 这两个属性来解决这个问题。 然而,还有一种更加简洁、灵活的方式——使用 margin: auto; 来实现居中以…