《计算机视觉中的多视图几何》笔记(10)

10 3D Reconstruction of Cameras and Structure

本章主要描述了如何利用2张图片来恢复相机的参数以及物体在三维空间中的形状。

文章目录

  • 10 3D Reconstruction of Cameras and Structure
    • 10.1 Outline of reconstruction method
    • 10.2 Reconstruction ambiguity
    • 10.3 The projective reconstruction theorem
    • 10.4 Stratified reconstruction
    • 10.5 Direct reconstruction – using ground truth

本章其实要解决两个问题。如何以及在多大程度上可以从两个视图中恢复场景和摄像机的空间布局。

  1. 三维空间的点 X i X_i Xi,是未知量。已知量是: x i x_i xi位于第一幅图像而 x i ′ x'_{i} xi位于第二幅图像。而且已知 x i x_i xi x i ′ x'_i xi是相互对应的: x i ↔ x i ′ x_i \leftrightarrow x'_i xixi,它们都是3D点 X i X_i Xi分别在第一、第二幅图像上的投影点,用公式表示为: x i = P X i x_i = PX_i xi=PXi, x i ′ = P ′ X i x'_i = P'X_i xi=PXi。如果点太少,这项任务是不可能完成的。然而,如果存在足够多的点对应关系以允许唯一地计算基本矩阵 F F F,则可以将场景重建。
  2. 三维重建就是要找到 P , P ′ P, P^{'} P,P,重建是有歧义的,歧义具体是指什么,如何消除这种歧义。如果提供有关摄像机或场景的附加信息,可以减少重建中的模糊性。 我们描述了一种两阶段的方法,其中歧义首先减少为仿射,然后减少为度量; 每个阶段都需要相应类别的信息。

10.1 Outline of reconstruction method

从2张图片来进行重建,步骤如下:

  1. 根据 x i ↔ x i ′ x_i \leftrightarrow x'_i xixi计算基本矩阵 F F F,其具体过程在11章叙述
  2. 根据 F F F求出摄像机外参 R , T R,T R,T,具体过程参见结论9.14
  3. 根据 R , T R,T R,T x i ↔ x i ′ x_i \leftrightarrow x'_i xixi求解 X i X_i Xi,这个过程叫三角化,具体步骤在12章

该方法可以有多种变体。 例如,如果相机被校准,那么我们将计算基本矩阵而不是基本矩阵。 此外,可以使用有关相机运动、场景约束或部分相机校准的信息来获得重建的细化。

要点:三角化唯一不能确定的点就是基线上的点,因为从两个光心出发的射线互相重合了。在这种情况下,反投影光线共线(均等于基线)并沿其整个长度相交。
在这里插入图片描述

10.2 Reconstruction ambiguity

如果我们仅仅知道若干图像,不可能恢复出三维空间点的绝对位置。
原因如下:
我们定义相似变换 H S H_{S} HS

[ R t 0 T λ ] \left[ \begin{matrix} R & t \\ 0^T & \lambda \\ \end{matrix} \right] [R0Ttλ]

我们有
P X i = ( P H s − 1 ) ( H s X i ) PX_i = (PH^{-1}_s) (H_sX_i) PXi=(PHs1)(HsXi)

如果把 P P P分解为 P = K [ R P ∣ t P ] P=K[R_{P}|t_{P}] P=K[RPtP],那么
P H S − 1 = K [ R P R − 1 ∣ t ′ ] PH^{-1}_{S}=K[R_{P}R^{-1}|t'] PHS1=K[RPR1t]

该结果表明乘 H S − 1 H_{S}^{-1} HS1不会改变 P P P的校准矩阵。因此,即使对于校准过的相机,重建也存在模糊性。对于校准相机来说,这是重建的唯一模糊之处。 因此,对于校准相机,可以通过相似变换进行重建。

因为 λ \lambda λ是任意的,所以有很多的 H s H_s Hs可以满足前式。几何解释如P265图10.2。
在这里插入图片描述
如果摄像机的内参也不知道,那么 H H H矩阵就是投影变换,投影变换只能保持直线还是直线,但是直线之间的角度就无法保持了。

以下介绍几种不同的重建类型。

10.3 The projective reconstruction theorem

Projective reconstruction的特点是相机没有标定。

结论 10.1:如果两幅图像中若干对应点已知,具体表示为 x i ↔ x i ′ x_i \leftrightarrow x^{'}_i xixi,那么我们可以求出基本矩阵 F F F,只需要 F F F就可以重建出三维空间中的点。而且任意更换相机投影矩阵,对重建没有影响,因为不同重建之间是等价的(比如第一次重建用的是 P 1 , P 1 ′ P_1,P'_1 P1,P1,第二次重建用的是 P 2 , P 2 ′ P_2,P'_2 P2,P2,但是点不能换,不管第一次重建还是第二次重建,都是用 x i ↔ x i ′ x_i \leftrightarrow x^{'}_i xixi,具体见书P266。

10.4 Stratified reconstruction

Stratified reconstruction指的是先有一个projective reconstruction,然后再把它优化到affine reconstruction最终metric reconstruction,如果可以的话。当然,需要注意的是想要得到affine或者metric reconstruction都需要额外知道一些关于重建场景本身的信息,或者相机要被标定过。

10.4.1 The step to affine reconstruction

我们现有一个project reconstruction的结果,记为 ( P , P ′ , { X i } ) (P,P^{'},\{X_i\}) (P,P,{Xi})。 现在我们需要找出一个平面 π \pi π,使其成为无穷远平面 ( 0 , 0 , 0 , 1 ) (0,0,0,1) (0,0,0,1)在图像上的投影。则必然存在一个 H H H,满足 H − 1 π = ( 0 , 0 , 0 , 1 ) H^{-1}\pi = (0,0,0,1) H1π=(0,0,0,1) H H H可以写成如下形式:

[ I ∣ 0 π T ] \left[ \begin{matrix} I | 0 \\ \pi^T \\ \end{matrix} \right] [I∣0πT]

找到了 H H H以后,把 H H H作用在所有重建得到的点上就完成了affine reconstruction。affine的意思就是说把我们得到的某平面投影到无穷远处。

那么如何找出 ( 0 , 0 , 0 , 1 ) (0,0,0,1) (0,0,0,1)到底映射到已知图像上的什么地方?以下给出几个例子。

Translational motion

简单来说就是摄像机从不同位置拍两幅图,但是摄像机本身只能有平移,不能有旋转。那么这两幅图中有一些点是没有移动的,比如月亮,比如一条延伸到无穷远处的公路。这样的话,月亮这一点的三维坐标写成 X i X_i Xi, 在两幅图像中的坐标写成 x i , x i ′ x_i,x^{'}_i xi,xi。这样三个点就确定了一个平面。该平面就是 ( 0 , 0 , 0 , 1 ) (0,0,0,1) (0,0,0,1)投影到拍摄图像上的结果。这两图拍摄图像对应的基本矩阵 F F F是一个斜对称(skew-symmetric)矩阵。

Scene constraints

场景约束主要目的就是为了找三个在无穷远平面上的点。比方说两个平行线为一组,可以确定无穷远平面上的一个点,这样找三组就可以了。具体步骤参见12章,13章。
另外一个需要注意的是,在一副图像中找出无穷远点以后,可以利用基本矩阵找出第二幅图像中的对应点,不用重新算一遍。

第二种方法是用相交直线之间的比例关系,具体过程参见书P47。

The infinite homography

当我们找出了无穷远平面 ( 0 , 0 , 0 , 1 ) (0,0,0,1) (0,0,0,1)在图像中的投影,我们实质上确定了一个映射 H ∞ H_{\infty} H H ∞ H_{\infty} H把图像 P P P中的点映射到 P ′ P' P。具体可以表示为 x ′ = H ∞ x i x' = H_{\infty}x_i x=Hxi

怎样求出这个 H ∞ H_{\infty} H? 假设我们现在有一个affine reconstruction,两个摄像机的外参表示为 P = [ M ∣ m ] P=[M|m] P=[Mm], P ′ = [ M ′ ∣ m ′ ] P'=[M'|m'] P=[Mm], H ∞ = M ′ M − 1 H_{\infty} = M'M^{-1} H=MM1

H ∞ H_{\infty} H还可以通过基本矩阵 F F F和三对无穷远点来计算,参见13章

One of the cameras is affine

在这种情况下如何求出affine reconstruction。我们有以下结论:

结论 10.4 ( P , P ′ , { X i } ) (P,P',\{X_i\}) (P,P,{Xi}) 是一个projective reconstruction。 P = [ I ∣ 0 ] P=[I|0] P=[I∣0]。所以 P P P是一个affine摄像机,那么affine reconstruction可以这样获得:交换 P , P ′ P,P' P,P的最后两列,交换 { X i } \{X_i\} {Xi}的最后两个坐标。

10.4.2 The step to metric reconstruction

metric reconstruction的要点是找到absolute conic。
比较实际的做法是在图像中找到absolute conic,该conic反投影回无穷远处的平面,就变成了cone,那么这个cone就定义了无穷远处的absolute conic。

结论 10.5 假设图像中的absolute conic已知,记为 ω \omega ω,affine reconstruction的相机外参已知,记为 P = [ M ∣ m ] P=[M|m] P=[Mm],那么affine reconstruction就可以利用一个矩阵 H H H变成metric reconstruction。 H H H如下所示:

[ A − 1 0 0 1 ] \left[ \begin{matrix} A^{-1} & 0 \\ 0 & 1 \\ \end{matrix} \right] [A1001]

其中 A A A 满足 A A − 1 = ( M T ω M ) − 1 AA^{-1} = (M^{T}\omega M)^{-1} AA1=(MTωM)1

我们可以把上式右边用Cholesky factorization处理,就可以得到 A A A

那么接下来的问题就是如何找到图像中的absolute conic?我们用 ω \omega ω来表示该conic。我们可以对该conic施加一些约束,然后再求解它。有这么几个约束:

  1. 被重建场景中的正交性
    消失点 v 1 , v 2 v_1,v_2 v1,v2分别来自两个正交的直线,那么他们满足 v 1 T ω v 2 = 0 v_1^{T} \omega v_2 = 0 v1Tωv2=0确定一个conic需要五个参数,那么找三对 v 1 , v 2 v_1,v_2 v1,v2就可以解出这个方程。或者 v 1 , v 2 v_1,v_2 v1,v2分别来自一条直线和一个平面(直线与平面正交)。 则他们满足 l = ω v l=\omega v l=ωv

  2. 相机内参
    因为 ω = K − T K − 1 \omega = K^{-T}K^{-1} ω=KTK1

  3. 根据上一条约束,我们知道 ω \omega ω只和相机内参有关系,跟外参没关系。那么我们可以用同一个相机在两个不同位置拍摄。这个过程可以表示为 ω ′ = H ∞ − T ω H ∞ − 1 \omega^{'} = H^{-T}_{\infty} \omega H^{-1}_{\infty} ω=HTωH1。 找出足够多的 H ∞ H_{\infty} H 也可以解出这个方程。

10.4.3 Direct metric reconstruction using ω \omega ω

我们有一个projective reconstruction,我们还知道 ω \omega ω,把 ω \omega ω在无穷远平面上的位置记为 Ω ∞ \Omega_{\infty} Ω,然后 ω \omega ω所在的平面记为 π ∞ \pi_{\infty} π。那么从 ω \omega ω Ω ∞ \Omega_{\infty} Ω的矩阵就可以求解出来,参见书P342练习题(x),知道这个矩阵,把它作用在projective的重建结果上,就得到了metric重建的结果。

10.5 Direct reconstruction – using ground truth

假设我们知道一些三维点的gt,记为 X E i X_{Ei} XEi,重建出来的点记为 X i X_i Xi,那么他们满足 X E i = H X i X_{Ei} = HX_i XEi=HXi,因为前文说过重建时有歧义的。我们把 X i X_i Xi替换为图像中的点 x i x_i xi那么就有 x i = P H − 1 X E i x_i = PH^{-1}X_{Ei} xi=PH1XEi。找出足够多的点,解这个方程就可以了。当我们知道了 H H H,就可以 H H H乘到相机矩阵 P , P ′ P,P^{'} P,P上,这样projective重建就变成了真实的三维坐标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/140615.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

批量、在线学习, 参数、非参数学习

批量学习(Batch Learning)和在线学习(Online Learning) 批量学习 批量学习的概念非常容易理解,我们之前介绍的许多机器学习算法,如果没有特殊说明,都可以采用批量学习的方式。批量学习的过程通…

【C++】布隆过滤器简单操纵模拟以及常见题目

🌏博客主页: 主页 🔖系列专栏: C ❤️感谢大家点赞👍收藏⭐评论✍️ 😍期待与大家一起进步! 文章目录 前言一、求下标仿函数的建议二、布隆过滤器代码面试题1.近似算法:2.精确算…

CompletableFuture-FutureTask

2. CompletableFuture 语雀 2.1 Future接口理论知识复习 Future接口(FutureTask实现类)定义了操作异步任务执行一些方法,如获取异步任务的执行结果、取消异步任务的执行、判断任务是否被取消、判断任务执行是否完毕等。 举例:…

Cortex-M3/M4之SVC和PendSV异常

一、SVC异常 SVC(系统服务调用,亦简称系统调用)用于产生系统函数的调用请求。例如,操作系统不让用户程序直接访问硬件,而是通过提供一些系统服务函数,用户程序使用 SVC 发出对系统服务函数的呼叫请求,以这种方法调用它…

“源启2.0”:从自上而下的解构,到自下而上的重构

从垂直打穿、到应用重构,中电金信赋能行业数字化转型之路既“向下走”、也“向上看”。“向上”先理解和吃透客户的企业战略,进而自上而下地将企业战略拆解为业务架构,“向下”再将业务架构拆解为应用架构和数据架构,并进一步对齐…

【Acwing1027】方格取数(动态规划)题解

题目描述 思路分析 错误思路: 贪心法,先走一次求出最大值,把走过的路上面的数值清零,然后用同样的方法再走一遍求最大值,然后让这两个最大值相加就是最后的结果。 很多人在看到这个题目的时候会有上面的思路&#x…

Jmeter接口测试

前言: 本文主要针对http接口进行测试,使用Jmeter工具实现。 Jmter工具设计之初是用于做性能测试的,它在实现对各种接口的调用方面已经做的比较成熟,因此,本次直接使用Jmeter工具来完成对Http接口的测试。 1.介绍什么是…

停车场系统源码

源码下载地址(小程序开源地址):停车场系统小程序,新能源电动车充电系统,智慧社区物业人脸门禁小程序: 【涵盖内容】:城市智慧停车系统,汽车新能源充电,两轮电动车充电,物…

Linux下ThinkPHP5实现定时器任务 - 结合crontab

实例一&#xff1a; 1.在/application/command创建要配置的PHP类文件&#xff0c;需要继承Command类&#xff0c;并重写configure和execute两个方法&#xff0c;例如: <?php namespace app\command; use think\console\Command; use think\console\Input; use think\cons…

“降本”是关键,FCU1104打造低成本工商业储能EMS

在不久前举行的EESA中国国际储能展上&#xff0c;“工商业储能”成为了热度最高的话题之一&#xff0c;几乎每家展出工商业储能系统的展商都收获了大量观众的驻足围观&#xff0c;热度非凡。究竟是怎样的原因让工商业储能如此瞩目呢&#xff1f; 通过与多家储能厂家沟通并查阅…

【音视频】ffplay源码解析-PacketQueue队列

包队列架构位置 对应结构体源码 MyAVPacketList typedef struct MyAVPacketList {AVPacket pkt; //解封装后的数据struct MyAVPacketList *next; //下一个节点int serial; //播放序列 } MyAVPacketList;PacketQueue typedef struct PacketQueue {MyAVPacketList …

论文精读(2)—基于稀疏奖励强化学习的机械臂运动规划算法设计与实现(内含实现机器人控制的方法)

目录 1.作者提出的问题及解决方向 2.延深-用如何用强化学习对机器人进行控制 2.1思路 2.2DQN和DDPG在机器人控制中的应用 3.解决方案 3.1思路 3.2实验 3.3创新点 4.展望 1.作者提出的问题及解决方向 目的&#xff1a;使机械臂在非结构化环境下实现端到端的自主学习控制…

MySQL学习笔记6

MySQL数据库如何存放数据&#xff1f; 注明&#xff1a;我们平常说的MySQL&#xff0c;其实主要指的是MySQL数据库管理软件。 一个MySQL DBMS可以 同时存放多个数据库&#xff0c;理论上一个项目就对应一个数据库。 如博客项目blog数据库&#xff0c;商城项目shop数据库&#…

(Vue2)智慧商城项目

新增两个目录api、utils api接口模块&#xff1a;发送ajax请求的接口模块 utils工具模块&#xff1a;自己封装的一些工具方法模块 第三方组件库vant-ui PC端&#xff1a;element-ui&#xff08;element-plus&#xff09; ant-design-vue 移动端&#xff1a;vant-ui Mint UI…

【计算机网络 - 自顶向下方法】计算机网络和因特网

目录 1. What is the Internet? 1.1 因特网的具体构成 1.2 因特网的功能 2. Network core 2.1 基本介绍 2.2 分组交换 2.2.1 序列化时延 2.2.2 排队延迟和丢包 2.2.3 分组交换的优缺点 2.3 电路交换 2.3.1 基本概念 2.3.2 电路交换网络中的复用 2.3.3 电路交换文件…

中秋国庆内卷之我爱学习C++

文章目录 前言Ⅰ. 内联函数0x00 内联函数和宏的比较0x01 内联函数的概念0x02 内联函数的特性 Ⅱ. auto&#xff08;C 11)0x00 auto的概念0x01 auto的用途 Ⅲ. 范围for循环(C11)0x00 基本用法0x01 范围for循环(C11)的使用条件 Ⅳ. 指针空值nullptr(C11)0x00 概念 前言 亲爱的夏…

Lnmp架构之mysql数据库实战2

4、mysql组复制集群 一主多从的请求通常是读的请求高于写 &#xff0c;但是如果写的请求很高&#xff0c;要求每个节点都可以进行读写&#xff0c;这时分布式必须通过&#xff08;多组模式&#xff09;集群的方式进行横向扩容。 组复制对节点的数据一致性要求非常高&#xff…

人工智能驱动的自然语言处理:解锁文本数据的价值

文章目录 什么是自然语言处理&#xff1f;NLP的应用领域1. 情感分析2. 机器翻译3. 智能助手4. 医疗保健5. 舆情分析 使用Python进行NLP避免NLP中的陷阱结论 &#x1f389;欢迎来到AIGC人工智能专栏~人工智能驱动的自然语言处理&#xff1a;解锁文本数据的价值 ☆* o(≧▽≦)o *…

1791_树莓派bash入门杂志_Essentials_Bash_v1

全部学习汇总&#xff1a; GreyZhang/little_bits_of_raspberry_pi: my hacking trip about raspberry pi. (github.com) 拿到一份树莓派早期的宣传电子杂志资料&#xff0c;看了一下感觉还是有一些帮助。针对里面多少有一些共鸣的地方&#xff0c;做一个简单的整理。 1. 命令行…

【kohya】训练自己的LoRA模型

文章目录 序言准备环境准备图片处理图片下载kohya_ss代码修改pyvenv.cfg启动界面访问地址生成字幕准备训练的文件夹配置训练参数开始训练遇到的问题&#xff1a; 序言 在把玩stable diffusion的webUI和comfyUI后&#xff0c;思考着自己也微调一个个性化风格的checkpoint、LyCO…