如何理解单目视觉slam中尺寸漂移问题

最近学习了ORB_SLAM2中计算sim3变换,其中对什么是尺寸因子和尺寸漂移问题还存在一些知识盲区,因此查看了一些别人写的文章以及自己的理解整理了一下这个问题。(感觉自己的理解还不是非常的准确,如果有朋友发现我理解不对的地方,欢迎在评论区指出,十分感谢!)

1.在理解这个问题之前先明白什么是尺度一致性(尺度不变性)?

以下面三张图为例(别人文章截取):

上面三张图像可以看作是相机由近到远依次拍摄,假如图片中小人的真实身高有1.8m,表现在图像里的话,图一小人占比50%的像素,图二小人占比5%像素,图三小人占比1%像素。如果按照所占像素的多少来确定一个物体大小的话,这个小人在三个图像中的大小就不一样了,但是小人的真实大小就是身高1.8m,因此不能依据一个物体所占像素的多少来确定一个物体大小。

所以为了实现尺度不变性(即使用一个标准可以表示三张图像中的小人大小一样),需要给特征加上尺度因子。在进行特征描述的时候,将尺度统一就可以实现尺度不变性了。

在slam里面我对尺度因子的理解是深度信息,如果我能知道这三张图像中的小人的深度信息的话,我就能通过小人所占像素多少+小人的深度作为标准来衡量图片中一个物体的真实大小了,这就实现了尺度不变性。

例如:第一张图片中小人占500个像素,计算得到深度为2,计算标准为500*2=1000;

第二张图片中小人占50个像素,计算得到深度为20,计算标准为50*20=1000;

第三张图片中小人占10个像素,计算得到深度为100,计算标准为10*100=1000;

所以最后经过这个标准将尺度统一后,三张图片中小人的尺度都为1000,实现了尺度不变性。

2.单目视觉slam中尺寸漂移问题

我的理解是保证尺度一致性的前提是计算出来的深度信息和距离信息是准确的。

单目视觉slam中尺寸漂移问题根本原因是单目相机无法仅根据一张图片得出物体的真实大小,也就无法确定物体的远近(深度距离),同理无法得出运动的尺度大小(运动距离),这是产生尺度漂移的根源。

同时,在使用三角测量原理计算深度时,受到特征点匹配精度的影响,较小的角度误差在经过多帧累积之后深度误差都会变得很大,从而无法保证尺度一致性。

在单目初始化的时候,先提取关键点并匹配,再根据对极几何求本质矩阵E,再从E中恢复R,t。其中得到的t是个单位向量,因为任意缩放t,极线约束都成立。你可以对t进行任意缩放。缩放完后,设第0帧的位置为相机坐标系原点,则第1帧的位置就可以由R, t得到。虽然这个t不是真值,但是可以固定下来。然后根据两帧的位置,可以对图像帧0和1中匹配的三维点进行三角化。(多点获取本质矩阵;恢复R,t;并根据R,t三角化计算出伪深度 )。

在单目初始化之后对于新的图像帧,都是通过前一帧的R,t为基础来计算当前帧的R,t,再利用该R,t三角化出地图点。问题就是,由于受到特征点匹配精度的影响,如果第一步算的R,t有误差,那么第二步三角化的三维点的深度就存在误差,也就是说其深度会存在一个缩放。对于新来的每一帧,都会有这样的问题,经过多帧累积之后深度误差都会变得很大,从而无法保证尺度一致性。

3.解决办法:

1、视觉和IMU融合。IMU可以测得高帧率的角速度和加速度,尤其当相机运动过快时,相机会出现运动模糊,或者两帧之间重叠区域太少以至于无法进行特征匹配,所以IMU是视觉信息的很好的补充,能在相机运动过快的时候给出一个较好的位姿估计。

2、后端优化时把尺度也作为一个优化变量,也可以减小尺度漂移问题。

4.为什么双目和深度相机没有尺寸漂移问题

由于相机结构的原因,双目相机和深度相机计算出来的深度信息和距离信息是准确的,因此不存在尺度漂移问题。

参考文章:

1.https://blog.csdn.net/qq_16184125/article/details/115053997

2.https://blog.csdn.net/lv15076050705/article/details/123644797?ops_request_misc=&request_id=&biz_id=102&utm_term=%E4%BB%80%E4%B9%88%E6%98%AF%E5%8D%95%E7%9B%AE%E7%9A%84%E5%B0%BA%E5%BA%A6%E6%BC%82%E7%A7%BB&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-2-123644797.142^v74^insert_down1,201^v4^add_ask,239^v2^insert_chatgpt&spm=1018.2226.3001.4187

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/62987.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微软推出 Hierarchical Transformer 实现更高准确率的语音评测

对于语言学习者来说,练习发音并获得及时准确的反馈,是提高口语水平的重要环节。多年来,微软一直深耕基于 Azure 认知服务的语音功能,不断优化语音评测[1]功能的底层技术,从准确率、流畅度、完整性和语音语调等方面&…

工作汇报PPT模板推荐

工作中我们难免少不了写各种各样的总结汇报,也会用到PPT。怎么写好一个让老板满意的工作汇报PPT呢?今天就给大家推荐PPT家园的工作汇报ppt模板。 隆重大气几何微立体风背景商务工作汇报PPT模板 简洁微立体风格,非常适合商务工作者的汇报ppt…

红色商务风季度工作总结汇报PPT模板

这是一套商务风季度工作总结汇报PPT模板.pptx共23张, 幻灯片模板使用了红色作为主色系,设置了丰富的动画效果,主要适用于通用行业,目录主要包括:上季度工作概述,工作完成情况,存在主要问题,下季度工作计划。 下载地址:商务风季度工作总结汇报PPT模板-行…

如何写好一份晋升PPT(附PPT模板)

又到了每年晋升述职的时间,在过去的 5、6 年里,我以评委身份参与了大量的晋升述职(主要是前端,也包括客户端和测试),也辅导了许多(100)组内外的同学,指导他们书写和完善 …

分享58个述职报告PPT模板,总有一款适合你

分享58个述职报告PPT模板,总有一款适合你 下面是文件的名字,我放了一些图片,文章里不是所有的图主要是放不下...,大家下载后可以看到。 链接:https://pan.baidu.com/s/1aGvoYXC4gEbKazjVRMQm3Q 提取码:r…

工作总结PPT怎么写?60套工作总结PPT模板:年度汇报、项目汇报,晋升述职

不要再做无用功了小伙伴们!在职场里,不管是经理还是老板,没事总想让我们做PPT汇报工作。月汇报、年度汇报、日常汇报、项目汇报,还有晋升述职、工作经验总结…总之就是数不胜数;俗话说得好:躲得了初一&…

【产品经理必备文档】述职报告/年终总结汇报ppt模板

今天和大家免费分享产品必备文档模板——产品经理述职文档(年终总结汇报)的ppt模板~~~ 【文档下载】 这个ppt模板可以在下方小程序里免费下载哦 【编写教程】 个人工作年终总结一般分成4部门:个人岗位职责、工作完成情况、年度经验总结、 1…

设计师调研必备的三张地图,超全面剖析(内含Fabrie模板)

在一个设计项目中,设计师将会面对非常多的决策瞬间。要做好这些决策,绝非只是凭直觉而行的,而需要有强有力的调研结果支撑。 此时,优秀的设计师不仅善用设计工具,更擅于选择合适的设计工具。 调研过程中通常会涉及到三…

【BUUCTF】MISC 来首歌吧

来首歌吧 1 注意:得到的 flag 请包上 flag{} 提交 自己动手上机解摩斯码>>> ..... -... -.-. ----. ..--- ..... -.... ....- ----. -.-. -... ----- .---- ---.. ---.. ..-. ..... ..--- . -.... .---- --... -.. --... ----- ----. ..--- ----. .---- --…

模仿QQ音乐

开发: Vue Vuerouter Vuex JS jquery Node 功能介绍: 查看推荐歌单歌单详情播放歌曲列表歌曲排行榜歌词详情歌曲进度条搜索播放歌曲 登录,退出功能 效果图 以上是获取热门歌曲到播放歌曲的效果图 接下来看看用到的核心代码吧 上面…

【电子学会】2020年09月图形化一级 -- 小鸡与鸭妈拥抱

小鸡与鸭妈拥抱 1. 准备工作 (1)背景:Farm; (2)角色:Chick、Duck。 2. 功能实现 (1)角色的初始位置、方向和造型如图所示。 (2)点击绿旗Chick向右走去,边走边切换造型; (3)点击绿旗Duck向左走去; (4)2个动物拥抱后停止移动,Duck播放声音“Duck”。 3…

米兰大学发布论文与猫咪叫声数据集,分类喵喵叫

来源:HyperAI超神经本文约1000字,建议阅读5分钟 米兰大学计算机系的研究团队,试图用隐式马尔科夫方法将猫咪在不同环境状态下的喵喵叫识别出来,他们还真的成功了。关键词:声音识别 动物AI 机器学习 深度学习 米兰大学的…

爬取股票信息(股票代码+价格)

用到的两个网站分别东方财富网和老虎社区 思路为先从东方财富网获取股票列表,列表包含所有的股票名称和代码。然后再根据股票代码从老虎社区获取到个股的价格信息。 直接上代码: import requests from bs4 import BeautifulSoup import re# 获得HTML页…

哪些日本人看来很普通的日文词汇,在我们眼里会很高大上?

小幽香 ,よろしく~ AhCrazyWomenHere、赫尔曼.哈里、Mikkeli Matlock 等人赞同 心象風景(しんしょうふうけい) 指非写实的,却在人脑海中浮现,被描述或被记忆的风景。(红A:Unlimited blade wor…

用AI处理Excel,提升工作效率(建议收藏)

准备 开始课程之前我们需要准备一些数据,用于后面的操作案例。在这儿,我们就借助New Bing生成一些数据。生成数据时候,我是用的Prompt为: 我给你一个标题,请给我20组数据"姓名 基本工资 满勤奖励 绩效奖金 总工…

第77篇一对多之稳定性研究(二)之学生发消息报错及array_unshift

关键词:一对多稳定性研究, 学生发消息报错,array_unshift 一、一对多稳定性研究 1.1 测试平台--本地服务器运行平台 老师端:带老师名字 https://localhost:9101/demos/index.html?roomid888&t600&&teaNameMobile莫言 学生一&#xff1…

chatgpt赋能python:Python网络摄像头:使用Python编写网络摄像头应用程序的最佳实践

Python网络摄像头:使用Python编写网络摄像头应用程序的最佳实践 Python是一种高级编程语言,被广泛应用于各种领域,包括网络摄像头。Python的简单易用和强大的功能使其成为网络摄像头应用程序的最佳选择。在本文中,我们将介绍Pyth…

避坑14_此浏览器或应用可能不安全。了解详情请尝试使用其他浏览器。

一、问题 登录谷歌浏览器同步数据时,显示如下错误: 此浏览器或应用可能不安全。请尝试使用其他浏览器。如果您使用的是受支持的浏览器,可以重新尝试登录。 二、解决方法 关闭chrome(最好重启电脑) 打开chrome文件所…

从知识直播和创新活动中,看搜狐的内容“新”路

5月17日,2023搜狐科技峰会顺利闭幕。 本次峰会讨论的内容前瞻且丰满。分享内容涵盖前沿科学突破,宇宙文明、天文卫星、人类永生,到展望人类未来,核聚变、6G通信、脑机接口,再到通用人工智能时代启幕下的行业变革&…

QQ 用 Electron 重构后,终实现 Linux、macOS、Windows 三端架构统一!

整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 经过 24 年的更迭,国民应用 QQ 已成为 80/90 后的回忆,00 后的主战场。而今,因为 QQ 一个最新版本的发布,吸引了不分年龄层次的技术人的目光。 7 月 3 日…