全局点云配准的新思考:没有良好初值时如何配准?

更多优质内容,请关注公众号:智驾机器人技术前线

1.论文信息

  • 论文标题:BiEquiFormer: Bi-Equivariant Representations for Global Point Cloud Registration

  • 作者:Stefanos Pertigkiozoglou*, Evangelos Chatzipantazis∗ and Kostas Daniilidis

  • 作者单位:宾夕法尼亚大学

  • 论文地址:https://arxiv.org/abs/2407.08729

2.摘要

本文的目标是解决全局点云配准(PCR)问题,即在不考虑扫描的初始姿态的情况下,找到点云之间的最优对齐。由于计算约束,这个问题对于传统的优化方法来说非常具有挑战性。首先,我们展示了当点云在空间中任意放置时,最先进的深度学习方法会出现巨大的性能下降。我们提出应该利用等变深度学习来解决这个任务,并且我们描述了PCR的特定类型的双等变性。然后,我们设计了BiEquiformer,这是一个新颖且可扩展的双等变流程,即对输入点云的独立变换是等变的。虽然一种简单的做法是独立处理点云,但我们设计了表达力强的双等变层,这些层融合了来自两个点云的信息。这使我们能够提取高质量的超点对应关系,进而实现稳健的点云配准。与最先进的方法的广泛比较表明,我们的方法在3DMatch和具有挑战性的低重叠3DLoMatch数据集的鲁棒设置中,在规范设置中实现了可比的性能,并在鲁棒设置中实现了更优越的性能。

3.主要贡献

  • 研究了在输入点云的刚性变换下,最先进方法的鲁棒性。在文中展示了许多流行的最先进方法在点云的初始姿态变化时性能下降的情况,当扫描之间的重叠度变小时,这种性能下降更加严重;

  • 建模并描述了PCR的特定双等变性属性。然后本文提出了新颖的层,这些层处理不变的、等变的以及不同类型的双等变特征,这些特征通过融合点云之间的信息来扩展标准的等变层;

  • 结合这些层,本文提出了一种新颖的、可扩展的等变点云配准流程。本文方法确保了一致的配准结果,无论输入点云的初始配置如何,都能在鲁棒设置中实现了最先进的配准精度,特别是在低重叠数据集中。

4.核心思想与方法

BiEquiFormer 是一个基于注意力的双等变流程,用于全局点云配准(PCR)。首先,等变内部点自注意力和点间交叉注意力层更新点上的标量和向量特征。然后使用双等变特征将输入向量对齐到同一框架,再应用等变交叉注意力。输出的不变粗特征用于提取一组候选粗匹配,这些匹配由精细点匹配模块处理以提取候选变换。使用从局部到全局的变换方案计算最终估计。在第一次变换估计之后(全局步骤),我们可以通过将双等变框架对齐块与当前旋转估计切换来迭代地应用 BiEquiFormer(局部步骤)。

本文算法框架

本文算法框架

5.实验仿真验证

6.总结 && 展望

在这项工作中,我们提出了一个新的双等变流程来解决全局PCR任务,即在不假设输入点云有良好初始猜测的情况下进行配准。我们研究了当前深度学习方法在输入扫描的姿态上的鲁棒性,并观察到,特别是在低重叠设置中,性能大幅下降。我们提出通过利用等变深度学习来解决这个问题,并制定并描述了PCR的双等变属性。由于标准的旋转等变层有较大的内存开销,但更重要的是,它们分别从每个点云提取特征,我们提出构建新颖的、富有表现力的双等变层,在提取每点特征的同时融合两个点云的信息。我们使用这些层构建了BiEquiformer,这是一个可扩展到场景级扫描中大量点的双等变注意力架构。我们在3DMatch和具有挑战性的3DLoMatch数据集上评估了我们的方法,表明我们的方法能够实现与其他非等变和等变最先进方法相当的甚至更优越的性能,特别是在鲁棒性指标上。

我们相信,对PCR的双等变性的明确制定和描述可以扩展到其他问题,例如机器人操作中的拾取和放置任务。我们有信心,我们在这项工作中设计的双等变层对这些任务也将是有益的。作为一个限制,我们指出尽管该方法在鲁棒性情况下实现了最先进的性能,但在规范设置中存在一个小差距。我们认为这可以归因于流程第一步中的VNN特征提取器的表现力。然而,目前高阶可控特征提取器还不能扩展到场景级扫描。

本文仅做学术分享,如有侵权,请联系删文!

更多优质内容,请关注公众号:智驾机器人技术前线

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/411779.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【循环顺序队的实现】

1.队列的逻辑结构 与 抽象数据类型定义 先进先出的线性表 在顺序队列中,我们使用头指针front指向队首元素;用尾指针rear指向队尾元素的下一个位置(当然这里的指针是用下标模拟出来的) 同时顺序队列中的元素当然是用数组来存储的 …

解决STM32使用J-Link可以擦除和读取但是无法烧录问题

现象 使用J-Link烧录模组固件,出现可以读取和擦除,但是无法烧录问题,提示错误如下: ERROR: Programming failed address 0x08000080 (program error)End of flash programmingERROR: Program failed 读出来的时候这个地址数据…

Linux 软件包管理器yum 自动化构建工具-make/makefile

Linux 工具 linux 软件包管理器 yum 把一些常用的软件提前编译好,做成软件包放在一个服务器上,通过包管理器可以很方便的获取到在这个编译好的软件包。直接进行安装。 软件包和软件包管理器就相当于 App 和应用商店这样的关系。 Linux 安装软件 源代码…

poe供电原理以及应用

1,根据IEEE802.3af标准,一个完整的PoE系统包括供电端设备PSE和受电端设备PD两部分; 供电设备PSE是整个系统的电源提供者,为PD设备提供直流电源,其可分为M

如何理解进程

一、进程的概念 进程:顾名思义,就是一个完整执行程序的过程。没错,就是这么简单,但是在程序执行的过程之中,系统会为这个执行的程序分配内存资源,这些过程也包含在进程当中。 进程是动态的,是程…

【网络编程通关之路】 Tcp 基础回显服务器(Java实现)及保姆式知识原理详解 ! ! !

本篇会加入个人的所谓鱼式疯言 ❤️❤️❤️鱼式疯言:❤️❤️❤️此疯言非彼疯言 而是理解过并总结出来通俗易懂的大白话, 小编会尽可能的在每个概念后插入鱼式疯言,帮助大家理解的. 🤭🤭🤭可能说的不是那么严谨.但小编初心是能让更多人…

Linux下IO多路复用—select,poll,epoll

一.概述 1.IO多路复用介绍 IO多路复用是一种操作系统的技术,用于在单个线程或进程中管理多个输入输出操作。它的主要目的是通过将多个IO操作合并到一个系统调用中来提高系统的性能和资源利用率,避免了传统的多线程或多进程模型中因为阻塞IO而导致的资源…

在Linux下搭建go环境

下载go go官网:All releases - The Go Programming Language 我们可以吧压缩包下载到Windows上再传到Linux上,也可以直接web下载: wget https://golang.google.cn/dl/go1.23.0.linux-amd64.tar.gz 解压 使用命令解压: tar -x…

解决有向图中节点出度和入度计算问题

解决有向图中节点出度和入度计算问题 引言邻接链表表示法邻接链表的数据结构创建图添加边计算节点的出度伪代码C代码计算节点的入度伪代码C代码时间复杂度示例结论引言 在图论中,有向图是一种重要的数据结构,用于表示元素之间的方向性关系。有向图中的节点(顶点)通过边连接…

VBA之正则表达式(47)-- 快速将公式转换为静态值计算

实例需求:工作表I列包含多种计算公式,为了便于演示,将I列公式显示在J列单元格中,现在需要将公式的单元格引用转换为静态值,如K列所示。 示例代码如下。 Sub RegExpDemoReplace()Dim Res()Dim objRegEx As ObjectDim o…

[解决]Invalid configuration `aarch64-openwrt-linux‘: machine `aarch64-openwrt

背景 交叉编译libev-4.19 问题 checking host system type… Invalid configuration aarch64-openwrt-linux: machine aarch64-openwrt’ not recognized 解决 打开config.sub,在244行后添加"| aarch64-openwrt \ "

Git学习(001 git介绍以及安装)

尚硅谷2024最新Git企业实战教程,全方位学习git与gitlab 总时长 5:42:00 共40P 此文章包含第1p-第p4的内容 文章目录 介绍Git介绍GitLab介绍 概述Git安装版本控制工具介绍 介绍 Git介绍 GitLab介绍 相当于中央仓库 概述 Git安装 进入官网(下载当前版本 2.43.0) …

解决 RT-Thread bsp stm32l476-st-nucleo STM32L4 HAL库缺失问题

问题描述 当前最新的 RT-Thread 版本:5.2.0,发现在 编译 BSP stm32l476-st-nucleo,缺少了 STM32L4xx_HAL 驱动库,造成生成的 工程,如 Keil MDK5 工程无法编译通过 初步的【临时】解决方法是 回退 RT-Thread 的版本&am…

rabbitmq发送的消息接收不到

1.消息被其他消费者消费 2.主要说的2这种情况,就是在延迟队列中,忘记给一个bean加注解导致日志报exchange not found. 这个报错,进而引发了bindings没有绑定。没有绑定的话,发送消息就会接收不到。

心脑血管科曹启富医生谈:引起高血压的原因

曹医生指出,高血压这一日益普遍的健康问题,其根源深藏于多重复杂因素之中。首要提及的便是年龄因素,它如同时间的刻度,悄然影响着我们的血管健康。随着年龄的增长,血管逐渐失去往昔的弹性与活力,变得僵硬而…

HTMl标签;知识回忆;笔记分享;

HTML标签是用于定义和组织网页内容的基础构建块。每个标签都有特定的作用。 一&#xff0c;标准结构标签&#xff1a; HTML文档标准结构&#xff1a; <html><head></head><body>this is my second html... </body> </html> 【1】htm…

python-FastApi框架

文章目录 FastApi一. 简介二. 特性三. 安装1. 安装fastapi模块2. 安装ASGI服务器( Uvicorn 或者 Hypercorn) 四. 实例1. 创建**main.py**文件(GET请求)2. 运行3. 测试4. 更新main_py(加入PUT请求) 五. 自动化API文档1. Swagger UI(交互式文档)2. ReDoc(可选式文档) FastApi 一…

企微获客链接 中文乱码问题处理

企微获客链接 中文乱码问题处理 问题背景问题处理补充内容 问题背景 为了推广产品&#xff0c;同时更好的服务客户&#xff0c;公司在接入企业微信后&#xff0c;需要用到企微获客链接相关推广操作&#xff0c;那么通过API 接口创建企微获客链接时&#xff0c;出现了中文乱码问…

OpenCV 图像处理基础算法介绍c++

VS2022配置OpenCV环境 关于OpenCV在VS2022上配置的教程可以参考&#xff1a;VS2022 配置OpenCV开发环境详细教程 图像处理 图像处理是一个广泛的领域&#xff0c;它涉及到对图像数据进行分析、修改和改进的各种技术。以下是一些基本的图像处理操作&#xff0c;这些操作通常可…

AntV G6 的坑之——渲染残留/残影

G6 4.x 依赖的渲染引擎 antv/g4.x 版本支持了局部渲染&#xff0c;带了性能提升的同时&#xff0c;也带来了图形更新时可能存在渲染残影的问题。比如拖拽节点时&#xff0c;节点的文本会留下轨迹。 解决办法&#xff1a; 关闭局部渲染&#xff0c;graph.get("canvas"…