VINS_MONO视觉导航算法【一】基础知识介绍

文章目录

  • VINS-Mono
    • 其他文章
    • 说明
    • 简介
      • 单目相机存在的尺度不确定问题
        • 缺乏深度信息
        • 尺度等价性
        • 对极几何和三角化
        • 平移和深度的关系
        • 解决尺度不确定问题的方法
          • 视觉惯性里程计(VIO)
          • 初始尺度估计
          • 持续尺度校正
      • 摄像头数据处理
        • 直接法(Direct Method)
          • 核心思想
          • 优化目标
          • 特点
          • 应用场景
        • 间接法(Indirect Method)
          • 核心思想
          • 优化目标
          • 特点
          • 应用场景
        • 比较总结
      • 六自由度(6-DOF)
      • 状态估计器
        • 回环检测
        • 重定位
        • 全局优化
        • 地图重用需求的增加
      • IMU初始化
        • 短时间IMU预积分值的初始化策略
          • 原理
          • 优点
          • 局限性
        • **单目惯性系统的封闭解及其改进**
          • 封闭解的提出
          • 改进:陀螺仪偏置校准
          • 局限性
      • IMU 预积分
        • 什么是预积分?
        • 为什么要预积分?
          • 避免重复计算
          • 便于动态调整偏置
          • 支持紧耦合优化
        • 预积分的具体步骤如下:
        • 预积分的过程示例
        • 优化中如何利用预积分?
      • 紧耦合
      • 回环检测
      • 重定位计算代价很小的原因
      • 四自由度什么意思?
      • 姿态图是什么?
        • 什么是姿态图?
        • 姿态图的结构
        • 姿态图的实现
          • 构建姿态图
          • 优化姿态图
          • 地图构建
      • 全局一致的地图
      • 地图合并
      • 前端和后端
        • 前端和后端的概念
          • 前端(Frontend)
          • 后端(Backend)
        • VINS-Mono中的前端和后端
          • 前端在VINS-Mono中的实现
          • 后端在VINS-Mono中的实现
        • 前端与后端的协作:一个实例
          • 前端的工作:
          • 后端的工作:
        • 总结
      • 欧拉角
        • 滚转角(Roll)
        • 俯仰角(Pitch)
        • 航向角(Yaw)
        • 理解欧拉角的整体概念
      • Ceres Solver
      • RANSAC
        • RANSAC 算法的基本步骤
        • 门限值的作用
        • 为什么需要门限值?
      • Eigen
        • 主要特点
        • 使用
        • 示例
          • 矩阵运算
          • 特征值分解

VINS-Mono

其他文章

  1. VINS_MONO视觉导航算法【一】基础知识介绍
  2. VINS_MONO视觉导航算法【二】论文讲解+GPU实现调研
  3. VINS_MONO视觉导航算法【三】ROS基础知识介绍
  4. VINS_MONO视觉导航算法【四】VINS_Mono代码解释

说明

我是SLAM小白,由于项目需要得学习一下VINS-Mono的简单原理和流程,因此总结了这个笔记便于后续查看,本文更加适合技术小白。当然初学VINS-Mono的也是没问题的。所用到的参考资料都已经标明。

这是第一篇,这一部分介绍一些SLAM中的基础概念和流程,主要是为纯新手(比如我)准备的,请先查看目录如果发现有相关的基础,请直接跳转到第3部分查看。

简介

VINS-Mono(Visual-Inertial Navigation System - Mono)是由香港科技大学(HKUST)空中机器人实验室开发的一种用于机器人或无人机等移动平台的单目视觉惯性导航系统。VINS-Mono结合了单目相机和惯性测量单元(Inertial Measurement Unit,IMU)的数据来实现精确的姿态估计和定位。

VINS-Mono是一个单目视觉惯性状态估计器,其中的鲁棒性,如果从论文来看而不涉及工程细节的话,是指其独特的初始化策略(实际上可以对相机与IMU间的外参、IMU与相机数据间时间戳进行在线校准,借助IMU和视觉的融合而可以应对更复杂苛刻的环境等也增加了其鲁棒性),而多用途则一方面因为其本身高性能(前端使用光流追踪特征点,后端使用滑动窗口,对于边缘端还可以使用只优化位姿的方法减少计算量),从而可以适配不同设备。论文中将VINS-Mono适配到了手持设备、小车和无人机上,都取得了很好的效果。另一方面状态估计本身就是很多应用的基石,自动驾驶,AR/VR都需要实时估计设备状态。

为什么做VINS-Mono:VINS-Mono 的设计动机主要是为了提供一种成本低廉且高效的六自由度(6-DOF)状态估计方法。六自由度状态估计的最小花费就是一个单目摄像头加一个低成本IMU。状态估计器的初始化过程是鲁棒性的。对IMU预积分值和相机观测进行紧耦合的非线性优化,以取得更准确的结果。

回环检测模块是紧耦合优化相结合,使重定位的计算代价很小。

利用四自由度的姿态图优化以取得全局一致的地图。保存地图和重用地图的方式很高效。通过姿态图优化,可以将当前地图和之前保存的地图进行合并。

单目相机存在的尺度不确定问题

单目相机(monocular camera)在状态估计中存在尺度不确定问题,这是由其固有的特性决定的。具体来说,单目相机只能捕捉二维图像信息,而无法直接获取深度信息。以下是详细的解释:

缺乏深度信息

单目相机拍摄的图像只能提供场景的二维投影,无法直接获取场景中物体的真实距离(深度)。这意味着,从单张图像中,我们无法判断一个物体的实际大小或它与相机之间的距离。例如,一张照片中的汽车可能是真实的汽车,也可能是玩具汽车,仅凭一张照片我们无法区分它们的大小和距离。

尺度等价性

在单目SLAM(Simultaneous Localization and Mapping)中,尺度等价性问题表现为:对于给定的图像序列,存在无限多个可能的三维结构和相机运动轨迹,这些结构和轨迹在图像平面上的投影是相同的。具体来说,如果我们将整个场景的尺度缩放一个常数倍,同时将相机的运动轨迹也缩放相同的倍数,那么在图像平面上观察到的特征点运动是完全相同的。

对极几何和三角化

单目相机通过特征点匹配和对极几何(epipolar geometry)来估计相机的运动和场景的结构。然而,对极几何只能提供相对的几何关系,而不能提供绝对的尺度信息。例如,通过基础矩阵(Fundamental Matrix)或本质矩阵(Essential Matrix)可以估计两帧图像之间的相对位姿(旋转和平移),但这些估计是尺度无关的。

平移和深度的关系

在单目SLAM中,深度信息的恢复依赖于相机的平移运动。当相机发生平移时,通过三角化(triangulation)方法可以恢复特征点的深度。然而,如果平移运动较小,特别是近似纯旋转时,三角化方法会失效,因为特征点的视差(disparity)太小,无法准确估计深度。因此,单目相机需要足够的平移运动才能可靠地估计深度。

解决尺度不确定问题的方法

尽管单目相机存在尺度不确定问题,但通过结合其他传感器(如IMU)可以有效地解决这一问题。以下是几种常见的方法:

视觉惯性里程计(VIO)

视觉惯性里程计(Visual-Inertial Odometry, VIO)结合了单目相机和惯性测量单元(IMU)的数据,通过融合视觉和惯性信息来估计相机的运动和场景的结构。IMU可以提供高频率的加速度和角速度测量,这些测量值可以用于估计相机的平移和旋转,从而提供尺度信息。IMU提供的是相对定位信息,即相对于初始状态的运动轨迹。这意味着IMU无法提供物体在全局坐标系中的绝对位置。例如,IMU可以告诉你物体相对于起点移动了多少距离,但无法告诉你物体当前的具体地理位置。

初始尺度估计

在VIO系统中,通常需要一个初始化过程来估计初始的尺度。这个过程可以通过多种方法实现,例如:

预积分IMU数据:在初始化阶段,通过预积分IMU数据,可以估计相机的平移和旋转,从而提供初始的尺度信息。

特征点深度归一化:在初始化阶段,可以将所有特征点的深度归一化,使其平均深度为1,这样可以控制场景的尺度,使计算在数值上更稳定。

持续尺度校正

在初始化之后,VIO系统可以通过持续的尺度校正来保持尺度的准确性。例如,通过最小化特征点的重投影误差(reprojection error),可以不断优化相机的位姿和特征点的深度,从而减少尺度漂移。

摄像头数据处理

直接法(Direct Method)
核心思想

直接法利用图像中每个像素的光度信息(灰度值或颜色值),通过计算当前帧与参考帧之间的光度误差,直接优化相机的位姿和深度信息。直接法通过优化光度误差(Photometric Error)来估计相机的运动和环境的结构。具体来说,直接法假设同一三维点在不同视角下的灰度值保持不变,通过最小化像素之间的光度误差来估计相机的运动。光度误差定义为当前帧和参考帧之间对应像素的亮度差异。数学上,可以表示为:

请添加图片描述

优化目标

光度误差:假设场景的光照不变,相邻图像帧中对应点的灰度值(或颜色值)应相同。直接法通过最小化这种光度误差,求解相机运动和场景的深度。

特点

初始值敏感:直接法需要一个较好的初始位姿估计(如通过IMU或粗糙匹配得到)。这是因为优化过程依赖梯度下降,初值差距过大会导致优化失败。直接法需要一个良好的初始值,否则优化过程可能会陷入局部极小值。这通常需要通过其他方法(如特征点法)提供一个初始估计。

稠密地图优势:直接法处理图像的所有像素,因此可以生成高分辨率、稠密的地图,适用于需要精细重建的场景(如AR/VR应用)。

不依赖特征点:直接法无需检测特征点,适用于纹理不丰富的场景(如平滑墙面),因为它充分利用了图像中每个像素的亮度信息。直接法对纹理较少的场景也能工作,因为不依赖于特征点的提取和匹配。这对于一些纹理较少的环境(如白墙或走廊)非常有用。

对光照变化敏感:假设光照恒定,这一假设在实际场景中可能不成立,比如光线变化或反射会导致误差增大。

应用场景

精细重建、场景稠密重建(如SLAM系统中的稠密模块)。

间接法(Indirect Method)
核心思想

间接法通过检测和匹配图像中的特征点(如角点、边缘等),计算特征点在相邻帧之间的重投影误差,然后优化相机位姿和场景的三维结构。间接法通过提取和匹配图像中的特征点(如角点、边缘等)来估计相机的运动和环境的结构。具体来说,间接法首先提取图像中的特征点,然后通过匹配这些特征点来建立对应关系,最后通过最小化重投影误差(Reprojection Error)来优化相机的运动参数。重投影误差定义为特征点在图像平面中的投影位置与其实际位置之间的差异。数学上,可以表示为:

请添加图片描述

优化目标

几何误差(重投影误差):将场景中的三维点投影到图像平面,与实际观测到的特征点位置比较,最小化两者的误差。

特点

技术成熟:间接法使用特征点(如SIFT、ORB等)进行匹配,算法成熟且在工程实践中被广泛应用。

鲁棒性高:特征点提取和匹配对光照变化、运动模糊有一定的鲁棒性,适合多样化的场景。但间接法依赖于特征点的提取和匹配,对于纹理较少或特征重复的场景容易失败。

计算复杂度高:间接法需要额外的步骤来提取特征点和进行特征匹配,相比直接法计算复杂度更高。但间接法只需要处理少量的特征点,计算复杂度较低,适用于实时应用。

稠密地图构建不占优势:间接法只处理稀疏的特征点,生成的地图通常是稀疏的,难以满足高分辨率重建的需求。

应用场景

实时定位(如VINS-Mono使用间接法)、稀疏地图构建、对计算资源要求较高的场景(如无人驾驶)。

比较总结
特性直接法间接法
优化目标光度误差重投影误差
输入数据图像的像素灰度/颜色信息提取的特征点信息
初始值要求需要良好的初始值对初始值依赖较低
对光照变化的敏感性敏感不敏感
地图构建适合稠密地图多用于稀疏地图
算法复杂度较低较高
实用性适合光滑、纹理少的场景适合特征丰富、动态变化的场景

六自由度(6-DOF)

六自由度(6-DOF)指的是一个刚体在三维空间中可以进行的所有独立运动。这六个自由度包括:

三个平移自由度:沿x轴、y轴和z轴的平移。

三个旋转自由度:绕x轴、y轴和z轴的旋转。

对于移动平台(如无人机、机器人等),准确估计这六个自由度的状态是非常重要的,因为它们直接影响到平台的定位和姿态控制。

状态估计器

状态估计器是一种算法或模型,用于估计系统的内部状态。在VINS-Mono中,状态估计器的任务是根据传感器数据(如相机图像和IMU数据),估计平台的位置、速度、姿态等状态参数。常见的状态估计方法包括扩展卡尔曼滤波器(EKF)、粒子滤波器(PF)和非线性优化方法。

在机器人导航、自动驾驶、增强现实(AR)和虚拟现实(VR)等应用中,状态估计是核心模块之一,用于确定机器人或设备在环境中的位置和姿态。然而,由于传感器噪声和累积误差的影响,状态估计器在长时间运行中会逐渐失去准确性。为了解决这一问题,回环检测(Loop Closure Detection)、重定位(Re-localization)和全局优化(Global Optimization)成为不可或缺的组件。

消除漂移和累积误差的方法:

回环检测

回环检测是指系统在运行过程中,通过检测当前场景是否与先前访问过的场景相似,识别出“回到原处”的情况。例如,当机器人经过一条熟悉的走廊时,回环检测可以判断它曾经到过这里。一旦检测到回环,系统就可以利用这一信息修正漂移,重新调整当前位姿,使轨迹与先前的路径一致,从而大幅降低累积误差对估计结果的影响。

回环检测是指机器人识别出它曾经到达过的位置,从而形成一个闭环。在SLAM(Simultaneous Localization and Mapping)过程中,机器人通过不断估计自身位置并构建地图。然而,由于传感器噪声和累积误差,这些估计会逐渐偏离真实值。回环检测通过识别先前访问过的位置,提供了一个强约束,可以显著减少累积误差。具体来说,回环检测通过比较当前帧与历史帧的相似性来识别潜在的回环。一旦检测到回环,系统会利用这些信息进行全局优化,修正地图和轨迹的累积误差。

重定位

重定位是指在系统因漂移或其他原因导致状态估计不准确时,利用已知的地图或环境特征重新确定系统的当前位置。重定位与回环检测相辅相成,例如当系统在未知环境中导航时,回环检测提供的位置约束可以用于帮助重定位,而重定位则确保系统能够快速恢复正常运行状态,避免因误差积累而“迷路”。

重定位是指机器人在迷失位置后重新找到自己的位置。在实际应用中,机器人可能会因为突然的环境变化、传感器故障或其他原因而失去位置信息。重定位通过匹配当前观测到的特征与已知地图中的特征,帮助机器人重新确定自己的位置。重定位通常与回环检测紧密结合,因为在检测到回环后,机器人需要重新校正自己的位置。重定位不仅可以帮助机器人恢复位置信息,还可以减少累积误差,提高系统的鲁棒性。

全局优化

全局优化通过对整个轨迹的位姿进行统一调整,消除局部和全局的误差。具体来说,全局优化将回环检测生成的约束(即某些关键帧之间的关系)加入姿态图中,重新优化整条轨迹。这种方法可以显著提高轨迹和地图的精度,使得系统在长期运行中保持全局一致性。例如,机器人在探索一个大型建筑时,最终生成的地图会更加准确、连贯。

全局优化是指在整个地图和轨迹上进行优化,以确保全局一致性和准确性。在SLAM过程中,局部优化通常用于实时处理,但这些优化只能减少局部误差,无法消除全局累积误差。全局优化通过利用回环检测提供的强约束,对整个地图和轨迹进行优化,确保所有关键帧和地图点的位置都是一致的。常见的全局优化方法包括基于图优化的方法(如Bundle Adjustment,BA)和基于非线性优化的方法。这些方法通过最小化重投影误差和其他误差指标,使地图和轨迹达到全局最优。

地图重用需求的增加

随着导航和定位系统的应用范围扩大,地图重用需求正在不断增加。地图重用指的是在不同时间或任务中多次使用同一地图,以节省时间和计算资源。例如,机器人在一个工厂中每天都执行相同的巡检任务,重复构建地图会浪费资源。而通过保存和重用之前生成的地图,系统可以直接在已知环境中快速定位。

此外,地图重用还需要解决如何将当前构建的地图与已有地图合并的问题。这可以通过全局优化技术实现,确保新旧地图之间的无缝对接,从而生成一张更大、更精确的全局地图。

IMU初始化

短时间IMU预积分值的初始化策略
原理

利用短时间IMU预积分值进行初始化的基本思想是,通过短时间内的IMU数据(通常是陀螺仪和加速度计的测量值)来估计相机的相对旋转。具体来说,可以在短时间内(例如几秒钟)收集IMU数据,并对其进行预积分,得到相对旋转的估计值。这种方法假设在短时间内IMU的偏置和噪声影响较小,因此可以得到较为准确的相对旋转估计。

优点

快速初始化:由于只需要短时间的IMU数据,这种方法可以快速完成初始化,适用于需要快速启动的场景。

简单易实现:相对于复杂的初始化方法,这种方法实现起来较为简单,容易理解和实现。

局限性

不能建模陀螺仪偏置和图像噪声:这种方法假设在短时间内IMU的偏置和噪声影响较小,但实际上这些因素仍然存在并且会影响初始化的准确性。特别是陀螺仪的偏置如果不进行校准,会导致累积误差,影响后续的状态估计。

依赖于高质量的IMU数据:如果IMU数据质量不高,例如存在较大的噪声或偏置,这种方法的性能会显著下降。

单目惯性系统的封闭解及其改进
封闭解的提出

为了克服上述方法的局限性,一些研究者提出了单目惯性系统的封闭解方法。这些方法通过数学推导,直接从IMU和视觉数据中求解出系统的初始状态,包括相机的位姿、速度、重力向量等。封闭解方法的优点在于可以直接得到初始状态的精确解,而不需要进行复杂的迭代优化。

改进:陀螺仪偏置校准

尽管封闭解方法在理论上提供了精确的初始状态估计,但在实际应用中,陀螺仪的偏置仍然是一个重要的问题。为了进一步提高初始化的准确性,一些研究者提出了在封闭解基础上加入陀螺仪偏置校准的方法。具体来说,通过优化代价函数,同时估计初始状态和陀螺仪偏置,从而提高初始化的鲁棒性和准确性。

局限性

依赖长时间的IMU双重积分:为了准确估计陀螺仪偏置,通常需要在较长时间内收集IMU数据,并进行双重积分。这种方法虽然可以提高偏置估计的准确性,但也引入了更多的不确定度,特别是在长时间积分过程中,IMU的噪声和偏置会累积,影响最终的估计结果。

不能估计IMU积分的不确定度:尽管可以通过优化方法估计初始状态和陀螺仪偏置,但这种方法通常不能准确估计IMU积分的不确定度。这意味着在后续的状态估计中,可能会忽略掉这些不确定度,导致估计结果不够准确。

IMU 预积分

什么是预积分?

预积分(Preintegration)是IMU数据处理中一项重要技术,旨在高效利用高频IMU数据,同时减少重复计算的代价。IMU输出的加速度和角速度数据通常采样频率很高(例如200Hz),相机的采样频率较低(例如20Hz)。在两帧图像间(即相机两次采样之间),IMU数据可以通过积分来预测系统的运动状态,例如:

一次积分:从加速度推算速度。

二次积分:从加速度推算位移。

预积分的核心思想是将这些计算提前在局部参考坐标系中完成,并以紧凑的形式存储结果。这样,后续优化时无需重复计算积分,极大提高了计算效率。

预积分是针对惯性测量单元(IMU)数据的一种优化处理方法。IMU高频率采样加速度和角速度,理论上可以通过两次积分得到运动的速度和位移。然而,在实际视觉惯性导航系统(VINS)中,每次优化如果都重新从IMU原始数据进行积分计算,将导致极高的计算开销。

IMU预积分是指在处理IMU数据时,不是简单地直接使用原始测量值,而是先对IMU数据进行积分处理,以估计在两个关键帧之间的相对运动状态。预积分的目的是:

减少计算量:通过预积分,可以减少后端优化中的计算量,因为不需要在每个IMU测量点上都进行优化。

提高精度:预积分考虑了IMU的偏差和非线性效应,可以更准确地估计状态。

误差传播:预积分过程中计算了误差的传播,这对于后端优化中的状态估计非常重要。

预积分(Pre-integration)是指在IMU数据处理过程中,将连续的IMU测量值(加速度和角速度)在相邻关键帧之间进行积分,以减少计算负担并提高系统的实时性。

为什么要预积分?
避免重复计算

IMU数据通常采样频率很高,例如200Hz,而相机的采样频率可能只有20Hz。在两帧相机数据之间,IMU数据可能采样上百次。如果每次优化都要重新计算这些积分,计算代价非常高。

便于动态调整偏置

IMU测量的加速度和角速度通常会受到偏置影响,预积分可以通过一阶线性化模型快速修正偏置:

请添加图片描述

不需要重新从原始IMU数据进行积分。

支持紧耦合优化

在VINS中,IMU预积分值作为视觉帧间约束的残差参与滑动窗口优化,方便融合IMU与视觉数据,提高最终位姿估计的精度。

IMU预积分是为了减少IMU数据的累积误差,并提高计算效率而采用的一种技术。具体来说:

累积误差:IMU数据通常包含噪声和偏差,长时间积分会导致累积误差。通过预积分,可以将一段时间内的IMU数据转换为一个等效的增量值,从而减少误差。

计算效率:预积分可以减少每次处理大量IMU数据的计算负担,提高系统的实时性。

预积分的具体步骤如下:
  • 采样:在每个IMU采样周期内,记录加速度和角速度数据。
  • 积分:对加速度和角速度数据进行积分,计算出在这段时间内的位移和旋转增量。
  • 等效增量:将这些增量值作为一个整体,用于后续的状态估计。
预积分的过程示例

请添加图片描述

优化中如何利用预积分?

请添加图片描述

紧耦合

紧耦合是指将不同传感器的数据紧密结合起来,进行联合优化,以提高系统的估计精度。在VINS-Mono中,紧耦合主要体现在以下几个方面:

  • 联合优化:将IMU预积分值和相机观测值同时纳入优化目标函数,通过非线性优化方法(如LM算法或Gauss-Newton算法)联合求解系统的状态参数。
  • 一致性约束:确保IMU和相机数据之间的一致性,避免由于传感器数据不一致导致的误差。

具体来说,紧耦合的优化目标函数可以表示为:

请添加图片描述

回环检测

回环检测是指机器人识别曾到达某场景,使得地图闭环的能力。在SLAM系统中,回环检测用于检测机器人是否回到了先前访问过的位置,从而减少累积误差,提高地图的全局一致性。

回环检测(Loop Detection)是一种在SLAM(Simultaneous Localization and Mapping,同时定位与建图)系统中识别机器人是否回到之前访问过的位置的技术。

回环检测的关键在于有效检测出相机是否曾经经过同一个地方,这样可以避免较大的累积误差,并使得当前帧和之前的某一帧迅速建立约束,形成新的较小的累积误差。VINS-Mono使用DBoW2(一种词袋位置识别方法)进行回环检测。它从图像中抽取500个特征角点并计算其BRIEF描述子,这些描述子用作视觉词袋在数据库里进行搜索,以识别是否曾经访问过相同的地方。

紧耦合优化是指将回环检测与系统的其他部分(如位姿图优化)紧密结合,共同优化。具体实现如下:

  • 特征提取与匹配:从图像中提取特征点(如ORB特征点),并使用词袋模型(BoW)或其他方法(如深度学习)进行特征匹配,找到可能的回环候选帧。
  • 相似性评估:通过计算候选帧与当前帧之间的相似度(如TF-IDF),评估回环的可能性。
  • 位姿优化:一旦检测到回环,通过优化方法(如Sim3变换)计算回环帧与当前帧之间的相对位姿,并更新位姿图。

重定位计算代价很小的原因

紧耦合:回环检测与位姿图优化紧密结合,减少了不必要的计算步骤。

高效匹配:使用词袋模型或其他高效的特征匹配方法,减少了匹配时间。

局部优化:在检测到回环后,只对局部地图进行优化,而不是全局优化,减少了计算量。

重定位的计算代价很小,因为VINS-Mono的回环检测模块与紧耦合优化相结合,可以高效地将滑动窗口的帧与过去的姿态关联在一起。在重定位时,回环的帧(滑动窗口中的帧)设为固定帧,这样可以很轻易地把回环帧的残差添加进优化中,从而实现重定位。

四自由度什么意思?

针对漂移问题,固定滚转角和俯仰角,仅优化位置和航向角,实现全局地图的统一和一致性。

姿态图是什么?

什么是姿态图?

姿态图(Pose Graph)是一种数据结构,用于表示机器人或相机在不同时间点的姿态(位置和方向)。在SLAM中,姿态图将机器人的路径表示为节点,节点之间的边表示连续姿态之间的变换。

姿态图是一种用于表示机器人或相机在空间中位置和姿态的图,其中的节点代表位姿(位置和方向),边代表位姿之间的关系。

姿态图(Pose Graph)是一种用于表示机器人或相机在环境中的运动轨迹的数据结构。在SLAM(Simultaneous Localization and Mapping,同步定位与建图)系统中,姿态图被广泛用于优化机器人的轨迹和构建地图。姿态图通过图的形式表示机器人的各个位姿(pose)及其之间的相对关系。

姿态图的结构

节点(Nodes):每个节点表示一个关键帧(keyframe),包含机器人的位姿信息(位置和姿态)。通常,位姿信息可以用6自由度(6-DOF)表示,即三个位置坐标(x, y, z)和三个旋转坐标(通常用四元数表示)。

边(Edges):每条边表示两个节点之间的相对位姿关系,即从一个节点到另一个节点的相对变换。边通常包含一个相对位姿估计和一个协方差矩阵,表示估计的不确定性。

姿态图的实现
构建姿态图

关键帧选择:在SLAM系统中,不是所有的帧都会存储下来,而是选择一些关键帧来代表整个地图。这些关键帧会作为姿态图的节点。

  • 视觉特征:通过视觉特征(如SIFT、ORB等)检测和匹配,选择具有足够特征点的帧作为关键帧。
  • 时间间隔:每隔一段时间选择一个关键帧。
  • 运动变化:当机器人发生较大运动变化时,选择一个关键帧。

位姿估计:

  • 视觉里程计:通过特征点匹配和三角化方法,估计相邻关键帧之间的相对位姿。
  • IMU数据:结合IMU数据(加速度计和陀螺仪),进行预积分,估计位姿变化。
  • 回环检测:通过特征点匹配和地图匹配,检测回环,即机器人是否回到了先前访问过的位置。

构建边:

  • 相对位姿:计算每个关键帧之间的相对位姿,作为边的权重。
  • 协方差矩阵:估计相对位姿的不确定性,用协方差矩阵表示。
  • 姿态图的边表示相邻关键帧之间的相对位姿。这些边可以是欧氏变换(包含平移和旋转)或相似变换(只包含旋转和缩放),具体取决于系统的需要和传感器的特性。
优化姿态图

非线性优化:

  • 目标函数:定义一个目标函数,通常是最小化所有边的误差平方和。
  • 优化算法:使用非线性优化算法(如Levenberg-Marquardt、Gauss-Newton等)优化目标函数,调整节点的位姿,使地图达到全局一致性。

约束条件:

  • 闭环约束:通过回环检测,添加闭环约束,使地图中的重复区域对齐。
  • 先验约束:利用已知的先验信息(如GPS数据、地图数据等),添加先验约束,提高优化的准确性。
地图构建

点云融合:

  • 点云生成:每个关键帧生成一个局部点云。
  • 点云对齐:通过优化后的位姿,将所有局部点云对齐,生成全局点云地图。

地图优化:

  • 全局优化:通过全局优化,进一步提高地图的精度和一致性。
  • 地图管理:管理地图的存储和更新,确保地图的高效性和实时性。

全局一致的地图

为什么四自由度的姿态图优化可以取得全局一致的地图?

四自由度的姿态图优化关注于旋转,这有助于校正全局地图中的累积旋转误差。由于旋转误差比平移误差更容易累积,优化旋转可以更好地保持地图的全局一致性。

减少变量:相比于六自由度(6-DOF)优化,四自由度优化减少了变量数量,简化了优化问题。

尺度一致性:通过优化尺度自由度,可以确保地图的尺度一致性,减少累积误差。

局部优化:通过局部优化,逐步改进地图的整体一致性。

地图合并

为什么通过姿态图优化,可以将当前地图和之前保存的地图进行合并

地图合并是指将当前地图与之前保存的地图进行融合,以扩大地图的覆盖范围和提高地图的精度。具体实现如下:

  • 回环检测:检测当前地图中的关键帧与之前保存地图中的关键帧之间的回环。回环检测提供了闭环约束,这些约束在姿态图优化中被用来校正漂移,使得当前地图与之前地图对齐。
  • 相对位姿计算:通过优化方法(如Sim3变换),计算回环帧之间的相对位姿。
  • 地图对齐:将当前地图与之前保存的地图对齐,使它们在全局坐标系中一致。
  • 全局优化:通过全局优化,确保合并后的地图达到全局一致性。姿态图优化考虑了整个路径上的所有姿态,这允许系统在全局范围内调整姿态,以最小化累积误差。

前端和后端

在VINS-Mono(或类似的视觉惯性导航系统)中,前端和后端分别指的是系统中不同的功能模块,它们的职责和处理数据的方式有显著差异。以下是两者的详细解释和VINS-Mono中的具体实现。

前端和后端的概念
前端(Frontend)

前端主要负责传感器数据的初步处理和特征提取,目的是为后端提供必要的数据输入。

处理内容:

从传感器中采集原始数据(如相机图像和IMU数据)。

进行数据预处理,例如特征点提取和跟踪、IMU预积分计算等。

输出视觉特征、IMU预积分结果以及相关初步估计结果。

前端的特点:

计算量相对较低,主要在传感器采集的帧率下运行。

注重实时性,确保结果能够迅速传递给后端。

输出是中间结果,可能不够精确,仍需后端优化。

后端(Backend)

后端主要负责全局的非线性优化,目标是对前端的初步结果进行进一步优化,以提高系统的精度和一致性。

处理内容:

基于前端提供的视觉特征和IMU数据,建立优化问题(如滑动窗口优化)。

利用非线性优化技术(如BA或图优化)求解相机位姿、IMU状态和其他参数(如IMU偏置)。

执行全局调整,如回环检测后的全局位姿图优化。

后端的特点:

计算量大,注重全局一致性和精度。

能够处理漂移等长期积累的问题(如回环检测和重定位)。

不一定实时运行,但需要对前端的结果进行纠正和完善。

VINS-Mono中的前端和后端
前端在VINS-Mono中的实现

VINS-Mono的前端主要处理视觉和惯性数据,具体任务包括:

视觉处理:

使用稀疏光流(KLT光流)算法跟踪特征点。

检测新特征点,并执行RANSAC进行异常点剔除。

维护关键帧(Keyframe),确保关键帧之间有足够的视差,以支持后续三角化。

IMU数据预积分:

计算相机帧之间的IMU预积分值,包括位置增量、速度增量和旋转增量。

处理IMU偏置,生成用于后端优化的初步残差。

前端输出:

视觉特征点的位置和匹配信息。

IMU预积分结果。

初步的位姿估计,用于滑动窗口优化的初始值。

后端在VINS-Mono中的实现

VINS-Mono的后端以滑动窗口优化为核心,通过非线性优化来整合前端数据,具体任务包括:

滑动窗口优化(VIO):

滑动窗口包含多个关键帧的IMU状态(位置、速度、姿态)和特征点信息。

根据前端提供的视觉观测和IMU预积分结果,构建残差方程。

最小化残差(如IMU残差、视觉重投影误差),优化系统状态。

回环检测和重定位:

检测是否回到已访问过的场景,通过几何一致性约束重新定位。

利用回环检测结果,执行全局位姿图优化,消除长期漂移。

全局优化(姿态图优化):

固定滚转角和俯仰角,只对位置和航向角进行优化,确保全局一致性。

允许地图保存和重用,通过合并历史地图与当前地图生成全局地图。

后端输出:

精确的当前位姿估计。

长期一致的全局地图和轨迹。

前端与后端的协作:一个实例

场景描述

假设一个无人机使用VINS-Mono在室内导航,当前它从位置A飞到位置B:

前端的工作:

相机采集的图像中,前端检测并跟踪了多个角点(如墙壁上的纹理)。

使用IMU数据进行短时间内的预积分,预测从A到B之间的位移。

输出初步估计:无人机从A移动了3米,方向朝北偏东。

后端的工作:

后端以滑动窗口优化为核心,利用前端的视觉观测和IMU数据,优化位置和姿态。

检测到无人机在位置B处看到了位置A的场景(回环检测),调整轨迹,修正漂移。

输出精确结果:无人机从A移动到B实际上是2.8米,方向稍偏北。

总结

在VINS-Mono中,前端快速处理传感器数据,生成中间结果;后端通过优化确保结果的全局一致性和精度。这种分工能够平衡实时性和精确性,是高效实现视觉惯性导航系统的关键设计理念。

欧拉角

滚转角(Roll)、俯仰角(Pitch)和航向角(Yaw)是描述三维空间中物体姿态(Orientation)的三个角度,统称为欧拉角(Euler Angles)。它们分别定义物体绕自身坐标系三个轴的旋转。

滚转角(Roll)

定义:滚转角描述物体绕自身**前后轴(通常是X轴)**的旋转角度。

常见场景:飞机的左右侧倾。

例子:

如果无人机的左侧翅膀向下倾斜,右侧翅膀向上翘起,滚转角就会偏离水平。

俯仰角(Pitch)

定义:俯仰角描述物体绕自身**左右轴(通常是Y轴)**的旋转角度。

常见场景:飞机的机头向上抬起或向下低落。

例子:

当无人机从水平飞行转为向上爬升时,俯仰角会增大。

航向角(Yaw)

定义:航向角描述物体绕自身**垂直轴(通常是Z轴)**的旋转角度。

常见场景:船舶或汽车的方向转向,飞机在水平面内的左右旋转。

例子:

如果无人机从面朝北转为面朝东,它的航向角会发生变化。

理解欧拉角的整体概念

欧拉角可以用来描述物体在三维空间中的任何姿态。

它们是以特定的旋转顺序定义的(如Roll -> Pitch -> Yaw)。

每个角的值都有方向:顺时针通常为正,逆时针为负(具体以定义坐标系为准)。

Ceres Solver

Ceres Solver [1] 是一个开源 C++ 库,用于大型复杂优化问题的建模和求解。它可以用来解决边界约束的非线性最小二乘问题和一般的无约束优化问题。

https://izhengfan.gitbooks.io/ceres-solver-cn/content/

RANSAC

RANSAC(RANdom SAmple Consensus)是一种迭代算法,用于从一组观测数据中估计数学模型的参数,同时识别和排除异常值(外点)。RANSAC 在计算机视觉、机器人学和其他领域中广泛应用,特别是在特征匹配、图像拼接、相机标定等任务中。

RANSAC 算法的基本步骤

随机选择样本:

随机选择一组最小的数据点(样本),这些点用于拟合模型。

拟合模型:

使用选定的样本点拟合模型(例如,基本矩阵、单应矩阵等)。

评估模型:

使用剩余的数据点(未被选中的点)评估模型的拟合程度。通常通过计算这些点与模型预测值之间的误差来评估。

确定内点:

如果误差小于某个预设的门限值(阈值),则认为该点是内点(inlier),否则认为是外点(outlier)。

重复迭代:

重复上述步骤多次,每次选择不同的样本点,找到具有最多内点的模型。

最终模型:

选择具有最多内点的模型作为最终模型。

门限值的作用

在 RANSAC 算法中,门限值(threshold)是一个关键参数,用于区分内点和外点。具体来说:

误差评估:

计算每个数据点与模型预测值之间的误差。这个误差可以是欧氏距离、代数距离或其他度量。

内点识别:

如果误差小于门限值,该点被认为是内点;否则,被认为是外点。

模型选择:

选择具有最多内点的模型作为最终模型。

为什么需要门限值?

减少噪声影响:

门限值有助于排除由于噪声或错误匹配引起的外点,从而提高模型的鲁棒性和准确性。

提高模型质量:

通过设置合理的门限值,可以确保模型主要基于可靠的内点拟合,从而提高模型的质量。

控制计算复杂度:

适当的门限值可以减少不必要的计算,提高算法的效率。

Eigen

Eigen 是一个高效的 C++ 模板库,用于线性代数计算。它提供了丰富的数学功能,包括矩阵运算、向量运算、几何变换、数值求解器等。Eigen 的设计目标是提供高性能、易用性和灵活性,使其成为许多科学计算、计算机视觉、机器学习和其他领域的首选库之一。

主要特点

高效性:

Eigen 使用模板元编程技术,能够在编译时生成高度优化的代码。

支持 SIMD(单指令多数据)指令集,如 SSE、AVX 和 NEON,以提高计算速度。

内存布局优化,减少内存访问开销。

易用性:

提供直观的 API,使得线性代数操作非常简洁和自然。

支持多种数据类型,包括浮点数、整数和复数。

动态和静态大小的矩阵和向量支持。

灵活性:

可以轻松地扩展和自定义,支持用户定义的数据类型和表达式。

支持多种矩阵存储格式,如密集矩阵、稀疏矩阵和对角矩阵。

广泛的数学功能:

基本的矩阵和向量运算,如加法、减法、乘法、转置等。

高级线性代数操作,如特征值分解、奇异值分解、LU 分解、QR 分解等。

几何变换,如旋转、平移和仿射变换。

数值求解器,如线性方程组求解和最小二乘法。

使用

在你的 C++ 项目中包含 Eigen 头文件,并使用其提供的类和函数。

#include <Eigen/Dense>int main() {// 创建一个 2x2 的矩阵Eigen::Matrix2d matrix;matrix << 1, 2,3, 4;// 创建一个 2 维向量Eigen::Vector2d vector;vector << 1, 2;// 矩阵和向量的乘法Eigen::Vector2d result = matrix * vector;// 输出结果std::cout << "Result of matrix * vector: " << result.transpose() << std::endl;return 0;}
示例
矩阵运算
#include <Eigen/Dense>#include <iostream>int main() {// 创建两个 3x3 的矩阵Eigen::Matrix3d matrix1;matrix1 << 1, 2, 3,4, 5, 6,7, 8, 9;Eigen::Matrix3d matrix2;matrix2 << 9, 8, 7,6, 5, 4,3, 2, 1;// 矩阵相加Eigen::Matrix3d sum = matrix1 + matrix2;// 矩阵相乘Eigen::Matrix3d product = matrix1 * matrix2;// 输出结果std::cout << "Sum of matrices:\\n" << sum << std::endl;std::cout << "Product of matrices:\\n" << product << std::endl;return 0;}
特征值分解
#include <Eigen/Dense>#include <iostream>int main() {
// 创建一个 3x3 的矩阵Eigen::Matrix3d matrix;matrix << 1, 2, 3,4, 5, 6,7, 8, 9;// 计算特征值和特征向量Eigen::EigenSolver<Eigen::Matrix3d> eigensolver(matrix);Eigen::Matrix3cd eigenvectors = eigensolver.eigenvectors();Eigen::Vector3cd eigenvalues = eigensolver.eigenvalues();// 输出结果std::cout << "Eigenvalues:\\n" << eigenvalues << std::endl;std::cout << "Eigenvectors:\\n" << eigenvectors << std::endl;return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/484451.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

「Mac畅玩鸿蒙与硬件42」UI互动应用篇19 - 数字键盘应用

本篇将带你实现一个数字键盘应用&#xff0c;支持用户通过点击数字键输入数字并实时更新显示内容。我们将展示如何使用按钮组件和状态管理来实现一个简洁且实用的数字键盘。 关键词 UI互动应用数字键盘按钮组件状态管理用户交互 一、功能说明 数字键盘应用将实现以下功能&…

AI PC处理器ARM架构-引入NPU和大模型

AI PC处理器架构变化&#xff1a;ARM低功耗、引入NPU和大模型 AI进化加速端侧落地&#xff0c;新一轮浪潮蓄势待发(2024)”。ARM(Advanced RISC Machine)架构和x86架构是两种主要的处理器架构&#xff0c;它们在设计理念、应用场景和性能特点等方面有显著的差异。 ARM架构是一…

华为的USG6000为什么不能ping通

前言&#xff1a; 防火墙usg6000v的镜像 链接: https://pan.baidu.com/s/1uLRk0-hnHRTLYLx1Pnplow?pwdtymp 提取码: tymp 看了好多毒文章&#xff0c;感觉写作业更有意思&#xff0c;可以了解新的知识 内容&#xff1a; 首先看毒文章是这样说的&#xff0c;华为的防火墙是…

Mac安装MINIO服务器实现本地上传和下载服务

0.MINIO学习文档 Minio客户端mc使用 | Elibaron学习笔记 1.Mac安装MINIO 中文官方网址&#xff1a;MinIO下载和安装 | 用于创建高性能对象存储的代码和下载内容 (1) brew 安装 brew install minio/stable/minio &#xff08;2&#xff09;安装完成&#xff0c;执行brew i…

墨者学院-登录密码重置漏洞分析

声明&#xff01; 文章所提到的网站以及内容&#xff0c;只做学习交流&#xff0c;其他均与本人无关&#xff0c;切勿触碰法律底线&#xff0c;否则后果自负&#xff01;&#xff01;&#xff01;&#xff01; 目录标题 前言解题过程总结 前言 在实际渗透测试中&#xff0c;登…

qt QPauseAnimation详解

1、概述 QPauseAnimation是Qt框架中的一个类&#xff0c;专门用于在动画序列中添加暂停效果。它继承自QAbstractAnimation&#xff0c;允许在动画组或动画序列中指定一个时间段的暂停。这对于创建复杂的动画序列非常有用&#xff0c;可以让动画在特定时刻暂停并保持状态。通过…

【热门主题】000076 探索单片机的奥秘:原理、编程与应用全解析

前言&#xff1a;哈喽&#xff0c;大家好&#xff0c;今天给大家分享一篇文章&#xff01;并提供具体代码帮助大家深入理解&#xff0c;彻底掌握&#xff01;创作不易&#xff0c;如果能帮助到大家或者给大家一些灵感和启发&#xff0c;欢迎收藏关注哦 &#x1f495; 目录 【热…

SpringMVC(1)

前言 1. SpringMVC简介 2. 入门案例 第一步导入坐标&#xff0c;SpringMVC和servlet 这样其实就把我们要用的Spring相关的都用上了 第三步就是加载这个bean 写配置类 第四步做一个Tomcat容器启动的配置 还要加上Tomcat插件 我们在创建一个快捷方式 注意由于我的JDK版本高…

jenkins+github+springboot自动部署

背景&#xff1a; 最近看流水线有点意思&#xff0c;就说自己也搞一套。 预期效果&#xff1a; idea提交代码后&#xff0c;GitHub接收&#xff0c;jenkins自动部署。【后续加个自动部署时的代码检查、单元测试、安全测试、sonarqube】 思路分析: idea上的spring代码push到gi…

RabbitMQ 客户端 连接、发送、接收处理消息

RabbitMQ 客户端 连接、发送、接收处理消息 一. RabbitMQ 的机制跟 Tcp、Udp、Http 这种还不太一样 RabbitMQ 服务&#xff0c;不是像其他服务器一样&#xff0c;负责逻辑处理&#xff0c;然后转发给客户端 而是所有客户端想要向 RabbitMQ服务发送消息&#xff0c; 第一步&a…

MSSQL2022的一个错误:未在本地计算机上注册“Microsoft.ACE.OLEDB.16.0”提供程序

MSSQL2022导入Excel的一个错误&#xff1a;未在本地计算机上注册“Microsoft.ACE.OLEDB.16.0”提供程序 一、导入情况二、问题发现三、问题解决 最近在安装新版SQLServer SSMS 2022后&#xff0c;每次导入Excel都会出现错误提示&#xff1a;未在本地计算机上注册“Microsoft.AC…

GPT 1到4代的演进笔记

1. GPT-1 标题是 Improving Language Understanding by Generative Pre-Training. 发表于 2018.02, 比 bert(发布于 2018.10) 早了半年. 1.1 动机 困难:NLU 任务是多样的, 有 {textual entailment, question answering, semantic similarity assessment, document classifica…

【06】 MySQL 数据表的约束都有哪些?理解与实践

文章目录 1. 主键约束&#xff08;Primary Key&#xff09;2. 外键约束&#xff08;Foreign Key&#xff09;3. 唯一约束&#xff08;Unique&#xff09;4. 非空约束&#xff08;Not Null&#xff09;5. 默认值约束&#xff08;Default&#xff09;6. 检查约束&#xff08;Chec…

element-ui的下拉框报错:Cannot read properties of null (reading ‘disabled‘)

在使用element下拉框时&#xff0c;下拉框option必须点击输入框才关闭&#xff0c;点击其他地方报错&#xff1a;Cannot read properties of null (reading disabled) 造成报错原因&#xff1a;项目中使用了el-dropdown组件&#xff0c;但是在el-dropdown里面没有定义el-dropdo…

工业—使用Flink处理Kafka中的数据_ChangeRecord1

使用 Flink 消费 Kafka 中 ChangeRecord 主题的数据,当某设备 30 秒状态连续为 “ 预警 ” ,输出预警 信息。当前预警信息输出后,最近30

丹摩征文活动 | AI创新之路,DAMODEL助你一臂之力GPU

目录 前言—— DAMODEL&#xff08;丹摩智算&#xff09; 算力服务 直观的感受算力提供商的强大​ 平台功能介绍​ 镜像选择 云磁盘创建 总结 前言—— 只需轻点鼠标,开发者便可拥有属于自己的AI计算王国 - 从丰富的GPU实例选择,到高性能的云磁盘,再到预配置的深度学习…

Java程序调kubernetes(k8s1.30.7)core API简单示例,并解决403权限验证问题,即何进行进行权限授权以及验证

简单记录问题 一、问题描述 希望通过Java程序使用Kubernetes提供的工具包实现对Kubernetes集群core API的调用&#xff0c;但是在高版本上遇见权限验证问题4xx。 <dependency><groupId>io.kubernetes</groupId><artifactId>client-java</artifact…

微信小程序wx.showShareMenu配置全局分享功能

在app.js文件中配置如下即可&#xff1a; onLaunch() {//开启分享功能this.overShare()},/*** 开启朋友圈分享功能* 监听路由切换/自动执行*/overShare() {wx.onAppRoute((res) > {// console.log(route, res)let pages getCurrentPages()let view pages[pages.length - …

生信软件开发1 - 设计一个简单的Windwos风格的GUI报告软件

1. 安装基础库 使用Windows 11标题样式和主题自定义UI窗口库pywinstyles&#xff08;github: https://github.com/Akascape/py-window-styles&#xff09;&#xff0c;结合python自带tkinter库设计一个报告GUI软件。 pip install pywinstyles2. 设计一个简单的Windwos风格的G…

【PlantUML系列】类图(一)

目录 一、类 二、接口 三、抽象类 四、泛型类 五、类之间的关系 六、添加注释 七、包图 八、皮肤参数 一、类 使用class关键字定义类&#xff0c;类名后跟大括号&#xff0c;声明类的属性和方法。 属性&#xff1a;格式为{visibility} attributeName : AttributeType…