经典文献阅读之--OverlapNet

0. 简介

我们在之前的博客中讨论了一些激光回环检测的方法,但是基本都是围绕着点云特征去做的,并未涉足过深度学习的相关方法,之前作者在查找《经典文献阅读之–BoW3D》资料时看到了一个比较感兴趣的工作《OverlapNet: Loop Closing for LiDAR-based SLAM》,同时这个文章还拥有对应的开源源码Github,非常适合复现以及学习。

1. 工作重心

同时定位和映射(SLAM)是大多数自主系统所需的基本能力。在本文中,我们讨论了基于自动驾驶汽车记录的3D激光扫描的SLAM闭环问题。我们的方法利用深度神经网络,利用从激光雷达数据生成的不同线索来寻找环路闭合。它估计广义到距离图像的图像重叠,并提供扫描对之间的相对偏航角估计。基于这些预测,我们处理环路闭合检测,并将我们的方法集成到现有的SLAM系统中,以改善其映射结果。

简单来说,作者通过深度学习完成点云转换为影像,然后做回环检测, 输出Overlap和yaw的操作步骤。

文中指出,本文的主要创新点有:

  1. 能够利用多个线索,不需提前知道两个雷达扫描的相对位姿,只利用范围、法向量、强度和语义等线索,使用深度神经网络直接估计两个激光雷达扫描的重叠率,以及相对偏航角。
  2. 结合里程计信息和重叠率预测实现闭环的检测、修正。
  3. 可以检测到的闭环整合到现有SLAM系统中,可以提高整体位姿估计的结果,产生全局一致的地图。
  4. 无需先验位姿信息,解决在自动驾驶中3D LiDAR SLAM 的闭环检测问题。
  5. 使用产生正确扫描匹配结果的OverlapNet网络预测初始化ICP

2. 详细算法

2.1 Overlap的概念

作者认为直接对比两个点云之间的距离不够精确,因为会受漂移的影响。因此提出用重叠率来代替距离检测回环。具体思路是由影像的overlap中来,要成功匹配两个图像并计算它们的相对姿态,图像必须重叠。这可以通过将重叠百分比定义为第一图像中的像素的百分比来量化,该像素可以在没有遮挡的情况下成功地投影回第二图像中。请注意,该度量不是对称的:如果图像对存在较大的尺度差异,例如,一幅图像显示一堵墙,另一幅显示该墙周围的许多建筑物,则第一到第二幅图像的重叠百分比可能较大,而第二到第一幅图像的交叠百分比较低。在本文中,我们使用了距离图像重叠的思想,明确地利用了距离信息
在这里插入图片描述
对于环路闭合,重叠百分比的阈值可用于决定两个激光雷达扫描是否在同一位置和/或环路闭合。对于环路闭合,这种测量可能比一对扫描记录位置之间的常用距离更好,因为位置可能会受到漂移的影响,因此不可靠。重叠预测与相对姿势无关,因此可用于查找环路闭合,而无需知道扫描之间的正确相对姿势。

2.2 激光雷达扫描对之间重叠的定义

文中使用激光雷达扫描的球面投影作为输入数据,将点云 P \mathcal{P} P投影到所谓的顶点贴图 V : R 2 → R 3 \mathcal{V}:\mathbb{R}^2→ \mathbb{R}^3 V:R2R3,其中每个像素映射到最近的3D点。每个点 p i = ( x , y , z ) p_i=(x,y,z) pi=(x,y,z)通过函数: R 3 → R 2 \mathbb{R}^3→ \mathbb{R}^2 R3R2转换到球坐标系,最后到图像坐标 ( u , v ) (u,v) (uv),通过
在这里插入图片描述
其中 r = ∣ ∣ p ∣ ∣ 2 r=||p||^2 r=∣∣p2是范围, f = f u p + f d o w n f=f_{up}+f_{down} f=fup+fdown是传感器的垂直视场, w , h w,h w,h是所得顶点映射 V \mathcal{V} V的宽度和高度。

对于一对激光雷达扫描 P 1 \mathcal{P}_1 P1 P 2 \mathcal{P}_2 P2,我们生成相应的顶点映射 V 1 、 V 2 \mathcal{V}_1、\mathcal{V}_2 V1V2。我们将时间步长为 t t t,且处于传感器为中心的坐标帧表示为 C t C_t Ct。坐标帧 C t C_t Ct中的每个像素通过姿态 T W C t ∈ R 4 × 4 T_{WC_t}\in\mathbb{R}^{4\times4} TWCtR4×4与世界帧W关联。给定姿态 T W C 1 T_{WC_1} TWC1 T W C 2 T_{WC_2} TWC2,我们可以将扫描点 P 1 \mathcal{P}_1 P1重新投影到另一个顶点映射 V 2 \mathcal{V}_2 V2的坐标系中,并生成重新投影的顶点映射 V 1 ′ \mathcal{V}^′_1 V1
在这里插入图片描述
然后,我们计算 V 1 ′ \mathcal{V}^′_1 V1 V 2 \mathcal{V}_2 V2中所有对应像素的绝对差,仅考虑与两幅距离图像中有效距离读数对应的像素。然后,重叠被计算为相对于所有有效输入的特定距离内的所有差异的百分比,即,两个激光雷达扫描 O C 1 C 2 O_{C_1C_2} OC1C2的重叠定义如下:
在这里插入图片描述
其中如果 a a a为真,则 ∏ { a } = 1 \prod\{a\}=1 {a}=1,否则为0。有效( V \mathcal{V} V)是 V \mathcal{V} V为单位的有效像素数,因为并非所有像素在投影后都具有有效的LiDAR测量值。

**简单来说就是将两个点云转化为二维图并且坐标系对齐,如果两个坐标差小于阈值记为1,否则为零,求和再除以两个图中像素较小的那个,**作者想用这个等式建立训练集。对于旋转,作者选择旋转多个角度,用最大重叠值代表最终重叠值。

2.3 网络结构

下图描述了所提出的重叠网络的概述。我们利用了多个线索,这些线索可以从单个激光雷达扫描中生成,包括深度、法线、强度和语义类概率信息。深度信息存储在由一个通道组成的范围图 R \mathcal{R} R中。我们使用顶点映射的邻域信息来生成法线映射 N \mathcal{N} N,它有三个通道编码法线坐标。我们直接从传感器获得强度信息,也称为缓解,并使用强度信息为单通道强度图 I \mathcal{I} I。使用RangeNet++计算逐点语义类概率,我们将其表示为语义图 S \mathcal{S} S。RangeNet++提供20个不同类的概率。为了提高效率,我们使用主成分分析将20维RangeNet++输出缩减为压缩的三维向量。信息被组合成一个大小为 64 × 900 × D 64×900×D 64×900×D的输入张量,其中64900是输入的高度和宽度, D D D取决于使用的数据类型.
在这里插入图片描述

这里没有特别仔细去研究,具体就是由两个共享权重的Legs和由Legs生成的相同特征体积对的Head组成。进一步说这个模型的作用就是将深度图,向量图,强度图,还用RangeNet++做了个语义图一起作为输入。

…详情请参照古月居

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32232.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python手把手教学:如何长截屏?

Python 手把手教学:如何长截屏? 导言 长截屏(full-page screenshot)是一种抓取整个网页、而不仅仅是可见区域的截屏。有时,你需要截取完整网页来记录信息、生成报告、分享内容或仅仅是作为计算机文件的样本。而 Pyth…

学计算机的女生后来都怎么样了?

上一篇:铁饭碗也不铁了 我估计有不少读者感兴趣,学计算机的女生都是怎么样的? 女程序员真的就如下面这张图形容的那样,没时间洗头、皮肤暗淡、黑眼圈吗?不尽然。 在我工作的9年里,我也接触过不少女开发。大…

chatgpt真好用——std::bind和std::function

chatgpt是一本正经的回答&#xff0c;有时候也是一本正经的胡说八道&#xff0c;不过挺有意思的。 下面回归正题&#xff0c;就是为何使用std::bind生成一个可调用的对象&#xff0c;叫做callable object。已经如何使用std::bind绑定类的成员函数。 #include <iostream>…

告别 ChatGPT:AI 工具与 ChatGPT 一样好(但很少有人使用它们)

在过去的几个月里&#xff0c;ChatGPT 获得了大量用户&#xff0c;因为它非常擅长编写电子邮件、博客、代码等等。但是&#xff0c;还有其他工具使用 ChatGPT 背后的模型来超越 ChatGPT 的功能。 在本文中&#xff0c;我将分享我认为比 ChatGPT 更好的工具列表&#xff0c;因为…

GPT来了,跑步迎接AI爆发的时代

你好&#xff0c;我是徐文浩&#xff0c;一个创办过一家AI聊天机器人公司的工程师。 有人说&#xff0c;编译原理、操作系统和图形学是程序员的三大浪漫。不过在整个计算机科学领域&#xff0c;还有一个超越这三者之外的存在&#xff0c;那就是人工智能。人工智能的诞生其实非…

ChatGPT将掀起新一轮革命?

年初&#xff0c;人工智能工具ChatGPT爆火&#xff0c;有关它的话题多次登上热搜&#xff0c;爆火程度已经压过已经火热两年之久的元宇宙。因此人工智能又再次成为科技圈的热门话题之一。风口转变之际&#xff0c;微软、谷歌、百度等科技巨头们迅速调转船头&#xff0c;冲向新的…

开始练说唱

快到饭点了, 今天上午看了看计算机的递归和简单的动态规划, 感觉良好, 不是很难, 做了几道题, 上楼梯, 走格子, 子集合并, 难度递增. 晚上再整理今天学习的内容, 现在没有代码就只能说说心得了. 递归就两种形式, 顶向下, 底向上, 但我觉得其实就一种形式, 底向上. 我觉得应该按…

说唱分析

参考介绍链接:说唱

怎样用计算机打出seeyouagain,怎么唱好seeyouagain说唱

怎么唱好seeyouagain说唱 关注:170 答案:2 mip版 解决时间 2021-01-31 18:23 提问者花开不败 2021-01-31 10:46 怎么唱好seeyouagain说唱 最佳答案 二级知识专家啾一口软脸 2021-01-31 12:13 我家有30顿小豆没卖&#xff0c;小豆不断的跌价&#xff0c;我该怎么办&#xff0c…

计算机说唱卖苹果是谁,苹果音乐第一张播放量过 10 亿的专辑,来自说唱歌手 Drake...

一天前&#xff0c;来自加拿大的说唱歌手 Drake 在 Instagram 上发布了一张照片&#xff0c;Drake 伸手勾住了苹果 CEO 蒂姆库克的肩膀。他们身前的一张海报说明了他们庆祝的原因&#xff0c;Drake 在今年 5 月发行的新专辑《Views》成为了第一张在苹果音乐上播放数量超过 10 亿…

百度“爱说唱”小程序,不会词曲创作也能畅快玩说唱!

“爱说唱”——不会词曲创作也能畅快玩说唱&#xff01; 什么是“爱说唱”智能小程序&#xff1f; 百度开发者大会上正式发布了百度智能小程序。《中国有嘻哈》改名为《中国新说唱》&#xff0c;但是不妨碍“你有freestyle吗&#xff1f;”的火爆。为此&#xff0c;百度特意为…

【中文说唱巅峰】幼稚园杀手(aka小号王)的炸弹 “异界来客“ 无损flac试

&#xff01;&#xff01;&#xff01;本资源仅供中文说唱爱好者学习&#xff0c;支持幼杀正版专辑&#xff01;&#xff01;&#xff01; 幸存者联盟 幼稚园杀手 南征北战赵辰龙 &#x1f98f;得一比 不过对于龙哥被喷的听感问题 怎么说呢 毕竟这个产量 比起aka伸手不见五指…

cdc有哪些rapper_cdc说唱会馆成员介绍

Cdc说唱会馆的成员目前主要有谢帝、王闪火、TY、higher brothers、李随、ANSRJ、孟子、猫儿师、LIL WHITE小白等。Cdc说唱会馆最先由老熊创建。谢帝、李尔新、ansrJ、白总、sleep cat作为第一批成员&#xff0c;一起创建了说唱会馆。说唱会馆的第一支cypher发布于2010年&#x…

说唱计算机网红,首档喊麦节目太奇葩,蹭了说唱热度,还请了被封杀网红当导师...

原标题&#xff1a;首档喊麦节目太奇葩&#xff0c;蹭了说唱热度&#xff0c;还请了被封杀网红当导师 首档喊麦节目太奇葩&#xff0c;蹭了说唱热度&#xff0c;还请了被封杀网红当导师 大家都知道&#xff0c;如今的综艺节目越来越多各种题材应有尽有&#xff0c;尤其是音乐类…

谷歌发布史上“最强大脑”——可以控制和操作机器人的AI模型

​谷歌发布了一款被誉为史上“最强大脑”的人工智能模型PaLM-E (Parameter-efficient Language Model with Explicit Memory)&#xff0c;该模型能够从海量的语言数据中学习到更加精准和智能的语言处理能力PaLM-E的出现意味着机器人可以成为更多面手&#xff0c;更加有利于各种…

Azure 数据库中文乱码的问题

1&#xff0c;创建数据库的时候记得选择中文的 2&#xff0c;更新中文的时候记得加上N 转载于:https://www.cnblogs.com/damsoft/p/6090262.html

完美解决Xmind打开乱码的问题

完美解决Xmind打开乱码的问题 前段时间重装系统&#xff0c;重新安装XMind软件&#xff0c;今天打开以前的文件&#xff0c;傻眼了&#xff0c;乱码了&#xff0c;如图所示~ 重新编辑&#xff0c;发现是有内容的&#xff0c;如图 以下是提供一种解决方法给大家供参考 判断应…

chatgpt赋能python:Python中如何输出两行文本

Python中如何输出两行文本 Python是一种强大、易于学习的编程语言&#xff0c;广泛用于web开发、数据分析、人工智能等领域。在python中&#xff0c;输出文本是十分常见和重要的操作。接下来&#xff0c;本文将介绍如何在python中输出两行文本&#xff0c;供初学者和有经验的工…

目前最全的XMind乱码的解决方法,亲测可用

前言 今天本来下了XMind&#xff0c;用来准备把HTML的思维导图写好。在网上找了破解版&#xff0c;当然我推荐还是这个老哥的博客https://blog.csdn.net/qq_16093323/article/details/80967867里面下载破解版。装的也很方便也很舒服&#xff0c;嗯~对如丝般顺滑。 好的&#…