【CVPR2021】LoFTR:基于Transformers的无探测器的局部特征匹配方法

LoFTR:基于Transformers的局部检测器

0. 摘要

  我们提出了一种新的局部图像特征匹配方法。我们建议先在粗略级别建立像素级密集匹配,然后再在精细级别细化良好匹配,而不是按顺序进行图像特征检测、描述和匹配。与使用成本体积搜索对应关系的密集方法相比,我们在 Transformer 中使用自注意力层和交叉注意力层来获得以两个图像为条件的特征描述符。Transformer 提供的全局感受野使我们的方法能够在低纹理区域产生密集匹配,在这些区域,特征检测器通常难以产生可重复的兴趣点。在室内和室外数据集上的实验表明,LoFTR的性能远远优于最先进的方法。在已发布的方法中,LoFTR在视觉定位的两个公共基准中也排名第一。

源码地址:https://github.com/zju3dv/LoFTR
论文下载地址:https://arxiv.org/pdf/2104.00680.pdf
效果如下:

LoFTR

1. 简介

  • 图像之间的局部特征匹配是许多 3D 计算机视觉任务的基石,包括运动结构 (SfM)、同步定位和映射 (SLAM)、视觉定位等。给定要匹配的两个图像,大多数现有的匹配方法由三个独立的阶段组成:特征检测、特征描述和特征匹配。在检测阶段,首先将角点等突出点检测为每个图像的兴趣点。然后,在这些兴趣点的邻域区域周围提取局部描述符。特征检测和描述阶段产生两组带有描述符的兴趣点,其点对点对应关系稍后通过最近邻搜索或更复杂的匹配算法找到
  • 使用特征检测器减少了匹配的搜索空间,并且产生的稀疏对应关系足以满足大多数任务,例如相机姿态估计。但是,特征检测器可能无法提取由于纹理不佳、重复图案、视点变化、照明变化和运动模糊等各种因素、图像之间可重复的那些足够的兴趣点。这个问题在室内环境中尤为突出,低纹理区域或重复图案有时会占据视野中的大部分区域。图 1 显示了一个示例。如果没有可重复的兴趣点,即使有完美的描述符,也不可能找到正确的对应关系
    在这里插入图片描述
  • 最近的一些论文试图通过建立像素密集匹配来解决这个问题。可以从密集匹配项中选择置信度分数高的匹配项,从而避免特征检测。然而,这些作品中卷积神经网络(CNNs)提取的密集特征具有有限的感受野,可能无法区分不明显的区域。取而代之的是,人类在这些不起眼的地区找到对应关系,不仅基于当地社区,而且具有更大的全局背景。例如,图1中的低纹理区域可以根据它们与边缘的相对位置来区分。这一观察结果告诉我们,特征提取网络中的大感受野至关重要
  • 基于上述观察结果,我们提出了基于局部特征的TRansformer(LoFTR),这是一种新型的无探测器的局部特征匹配方法。受开创性工作 SuperGlue [37] 的启发,我们使用 Transformer 与自我和交叉注意力层来处理(转换)从卷积主干中提取的密集局部特征。首先以较低的特征分辨率(图像尺寸的 1/8)在两组变换的要素之间提取密集匹配。从这些密集匹配中选择具有高置信度的匹配项,然后使用基于相关性的方法细化到亚像素级别。Transformer 的全局感受野和位置编码使转换后的特征表示与上下文和位置相关。通过多次交错自我和交叉注意力层,LoFTR 学习了在真值匹配中表现出的密集排列的全局同意匹配先验。还采用了线性变压器,将计算复杂度降低到可管理的水平。
  • 我们评估了所提出的方法在室内和室外数据集的多个图像匹配和相机姿态估计任务上。实验表明,LoFTR 的性能远远优于基于探测器和无探测器的特征匹配基线。LoFTR 还实现了最先进的性能,并在两个视觉本地化公共基准上在已发布的方法中排名第一。与基于探测器的基线方法相比,LoFTR 即使在纹理低、运动模糊或重复图案的不明显区域也能产生高质量的匹配。

2. 相关工作

2.1 基于检测器的局部特征匹配

  • 基于检测器的局部特征匹配。基于检测器的方法一直是局部特征匹配的主要方法。在深度学习时代之前,许多著名作品在传统手工制作的本土特色上都取得了不错的成绩。SIFT 和 ORB可以说是最成功的手工制作的局部特征,在许多 3D 计算机视觉任务中被广泛采用。通过基于学习的方法,可以显著提高局部特征的大视点和照明变化的性能。值得注意的是,LIFT 和 MagicPoint 是首批成功的基于学习的本地功能之一。他们采用基于探测器的手工设计方法,并取得了良好的性能。SuperPoint[9]以MagicPoint为基础,提出了一种通过同形异义适应的自监督训练方法。沿这条线的许多基于学习的局部特征也采用了基于检测器的设计。
    -上述局部要素使用最近邻搜索来查找提取的兴趣点之间的匹配项。最近,SuperGlue提出了一种基于学习的局部特征匹配方法。SuperGlue接受两组兴趣点及其描述符作为输入,并使用图神经网络(GNN)学习它们的匹配,GNN是Transformers的一般形式。由于可以通过数据驱动的方法学习特征匹配中的先验,因此 SuperGlue 实现了令人印象深刻的性能,并在局部特征匹配方面开创了新的技术水平。然而,作为一种依赖于探测器的方法,它有一个根本的缺点,即无法检测无特征区域中的可重复兴趣点。SuperGlue 的注意力范围也仅限于检测到的兴趣点。我们的工作受到 SuperGlue 的启发,在 GNN 中使用自注意力和交叉注意力在两组描述符之间传递消息,但我们提出了一种无检测器设计,以避免特征检测器的缺点。我们还在 Transformer 中使用了注意力层的高效变体来降低计算成本

2.2 无检测器局部特征匹配

  • 无检测器方法消除了特征检测器阶段,直接生成密集描述符或密集特征匹配。密集特征匹配的想法可以追溯到SIFT Flow。是第一个基于学习的方法,用于学习具有对比损失的像素特征描述符。与基于检测器的方法类似,最近邻搜索通常用作后处理步骤,以匹配密集描述符。NCNet提出了一种不同的方法,即以端到端的方式直接学习密集的对应关系。它构造 4D 成本体积以枚举图像之间所有可能的匹配项,并使用 4D 卷积来规范成本量并在所有匹配项之间强制邻域共识。稀疏NCNet 改进了NCNet,使其在处理稀疏卷积时更加高效。在我们的工作的同时,DRC-Net 遵循了这一工作思路,并提出了一种从粗到细的方法,以产生具有更高精度的密集匹配。尽管所有可能的匹配都包含在 4D 成本体积中,但 4D 卷积的感受场仍然局限于每个匹配的邻域区域。除了邻里共识之外,我们的工作重点是借助变形金刚中的全局感受野实现匹配之间的全局共识,这在 NCNet 及其后续作品中没有得到利用。还有学者提出了 SfM 与内窥镜视频的密集匹配管道。最近的研究方向侧重于桥接局部特征匹配和光流估计的任务,也与我们的工作有关

2.3 视觉任务中的transformer

  • Transformer 已成为自然语言处理 (NLP) 中序列建模的事实标准,因为它们的简单性和计算效率。最近,Transformers在计算机视觉任务中也越来越受到关注,例如图像分类,目标检测和语义分割。在我们的工作的同时,建议使用Transformer进行视差估计。由于查询和关键向量之间的乘法,vanilla Transformer 的计算成本与输入序列的长度呈二次增长。最近在处理长语言序列的背景下提出了许多有效的变体。由于这些作品中没有假设输入数据,因此它们也非常适合处理图像

3. 方法

  • 在图像对 A和 B中,现有的局部特征匹配方法使用特征检测器来提取兴趣点。我们建议通过无探测器设计来解决特征探测器的可重复性问题。图2给出了所提出的LoFTR方法的概述。
    在这里插入图片描述

  • 图2:所提方法概述,LoFTR 有四个组件:

    • 1.局部特征 CNN 从图像对 I A 和 I B 中提取粗级特征图 F ̃A 和 F ̃B,以及精细特征图 FˆA 和 FˆB(第 3.1 节)。
      1. 将粗略的特征图展平化为一维向量,并添加位置编码。然后,添加的特征由局部特征 TRansformer (LoFTR) 模块处理,该模块具有 Nc 自注意力和交叉注意力层(第 3.2 节)。
      1. 使用可微匹配层来匹配变换后的特征,最终得到置信矩阵 Pc。根据置信度阈值和互近邻条件选择 Pc 中的匹配项,生成粗略匹配预测 Mc(第 3.3 节)。
      1. 对于每个选定的粗略预测 ( ̃i, ̃j) ∈ Mc,将从精细级特征图中裁剪出一个大小为 w × w 的局部窗口。粗略匹配将在此本地窗口中细化为亚像素级别,作为最终匹配预测 Mf(第 3.4 节)。

3.1 局部特征提取

  • 我们使用带有 FPN(表示为局部特征 CNN)的标准卷积架构来提取来自两个图像的多级特征。我们使用 F ̃A 和 F ̃B 表示原始图像尺寸 1/8 处的粗级特征,FˆA 和 FˆB 表示原始图像尺寸 1/2 处的精细级特征
  • 卷积神经网络(CNNs)具有平移等方差和局部性的归纳偏差,非常适合局部特征提取。CNN引入的下采样还减少了LoFTR模块的输入长度,这对于确保可控的计算成本至关重要。

3.2 3.2. Local Feature Transformer (LoFTR) 模块

  • 局部特征提取后,F ̃A 和 F ̃B 通过 LoFTR 模块提取与位置和上下文相关的局部特征。直观地说,LoFTR 模块将特征转换为易于匹配的特征表示。我们将变换后的特征表示为 F ̃A tr 和 F ̃B tr 。
    在这里插入图片描述
  • 初步:Transformer: 我们首先在这里简单介绍一下 Transformer 作为背景。Transformer 编码器由顺序连接的编码器层组成。图3(a)显示了编码器层的结构。
  • 编码器层中的关键要素是注意力层。注意图层的输入向量通常命名为 query、key 和 value。与信息检索类似,查询向量 Q 根据从 Q 的点积计算出的注意力权重和每个值 V 对应的键向量 K 从值向量 V 中检索信息。注意力层的计算图如图3(b)所示。从形式上讲,注意力层表示为:
    在这里插入图片描述
  • 直观地说,注意力操作通过测量查询元素与每个关键元素之间的相似性来选择相关信息。输出向量是按相似性分数加权的价值向量的总和。因此,如果相似度很高,则从值向量中提取相关信息。这个过程在图神经网络中也称为“消息传递”。
  • 线性 Trandformer: 将 Q 和 K 的长度表示为 N,它们的特征维度表示为 D,Transformer 中 Q 和 K 之间的点积引入了计算成本,该成本随输入序列的长度呈二次增长 (O(N2 ))。在局部特征匹配的上下文中直接应用原版的 Transformer 是不切实际的,即使输入长度被局部特征 CNN 减少也是如此。为了解决这个问题,我们建议在 Transformer 中使用原版注意力层的有效变体。Linear Transformer 提出将原注意力层中使用的指数核替换为替代核函数 sim(Q, K) = φ(Q) ·φ(K) T ,其中 φ(·) = elu(·) + 1。图3(c)中的计算图说明了该操作。
  • 利用矩阵产物的缔合性,可以先进行φ(K)T和V之间的乘法。由于 D ≪ N,计算成本降低到 O(N)。
  • 位置编码: 我们在 DETR [3] 之后的 Transformer 中使用标准位置编码的 2D 扩展。与 DETR 不同的是,我们只将它们添加到主干输出中一次。我们将位置编码的正式定义留在补充材料中。直观地说,位置编码以正弦格式为每个元素提供唯一的位置信息。通过将位置编码添加到 F ̃A 和 F ̃B,转换后的特征将变得与位置相关,这对于 LoFTR 在非显着区域生成匹配的能力至关重要。如图4(c)的底行所示,尽管输入的RGB颜色在白墙上是均匀的,但转换后的特征F ̃A tr和F ̃B tr对于平滑的颜色渐变所展示的每个位置都是唯一的。图 6 中提供了更多可视化效果。
  • Self-attention and Cross-attention Layers。对于自注意力层,输入特征 fi 和 fj(如图 3 所示)相同(F ̃A 或 F ̃B)。对于交叉注意力层,输入特征 fi 和 fj 是 (F ̃A 和 F ̃B) 或 (F ̃B 和 F ̃A),具体取决于交叉注意力的方向。在[37]之后,我们通过Nc时间交错LoFTR模块中的自我和交叉注意力层。LoFTR中自我和交叉注意力层的注意力权重在图4(c)的前两行中可视化。

3.3 建立粗级匹配

  • 在LoFTR中可以应用两种类型的可微匹配层,一种是最优传输(OT)层,另一种是双softmax算子。变换特征之间的得分矩阵 S 首先由 S (i, j) = 1 τ ·hF ̃A tr (i), F ̃B tr (j)i.当与OT匹配时,−S可以用作部分分配问题的成本矩阵,如[37]所示。我们还可以在 S 的两个维度上应用 softmax(在下文中称为 dual-softmax)来获得软互最近邻匹配的概率。正式地,当使用dual-softmax时,匹配概率Pc由以下方式获得:
    在这里插入图片描述
  • 匹配选择: 基于置信矩阵 Pc,我们选择置信度高于 θc 阈值的匹配项,并进一步执行互最近邻 (MNN) 标准,该标准过滤可能的异常粗略匹配项。我们将粗略级别的匹配预测表示为:在这里插入图片描述

3.4. 从粗到细模块

  • 建立粗略匹配后,使用粗细模块将这些匹配细化为原始图像分辨率。受 [50] 的启发,我们为此使用了基于相关性的方法。对于每个粗略匹配 ( ̃i, ̃j),我们首先在精细级特征图 FˆA 和 FˆB 上定位其位置 (ˆi, ˆj),然后裁剪两组大小为 w × w 的局部窗口。然后,较小的 LoFTR 模块将每个窗口内的裁剪要素按 Nf 倍进行变换,从而生成两个分别以 ˆi 和 ˆj 为中心的变换后的局部特征图 FˆA tr (ˆi) 和 FˆB tr (ˆj)。然后,我们将 FˆA tr (ˆi) 的中心向量与 FˆB tr (ˆj) 中的所有向量相关联,从而生成一个热图,表示 ˆj 与 ˆi 邻域中每个像素的匹配概率。通过计算对概率分布的期望,我们得到了 I B 上具有亚像素精度的最终位置 ˆj ′。 收集所有匹配项 {(ˆi, ˆj ′ )} 生成最终精细级匹配项 Mf 。

3.5. 监督

  • 最终损失由粗级和细级的损失组成:L = Lc + Lf 。
  • 粗略级监督: 粗层的损失函数是最佳传输层或双 softmax 算子返回的置信矩阵 Pc 上的负对数似然损失。我们遵循 SuperGlue 使用相机姿势和深度图来计算训练期间置信矩阵的真值标签。我们将真值粗匹配Mgt_c定义为两组1/8分辨率的互近邻网 格。两个格网之间的距离通过其中心位置的重新投影距离来衡量。补充文件提供了更多详细信息。对于最佳输运层,我们使用与[37]相同的损耗公式。当使用 dual-softmax 进行匹配时,我们最小化了网格上的负对数似然损失,以 Mgt_c 为单位:
  • 精细监督。我们使用 l2 损失进行精细化。在 [50] 之后,对于每个查询点 ˆi,我们还通过计算相应热图σ的总方差 2 (ˆi) 来衡量其不确定性。目标是优化具有低不确定性的精细仓位,从而得到最终的加权损失函数:
  • 其中 ˆj ′ gt 是通过将每个 ˆi 从 FˆA tr (ˆi) warp 到 FˆB tr (ˆj) 来计算的,具有地面实况相机姿态和深度。在计算 Lf 时,如果 ˆi 的warp位置落在 FˆB tr (ˆj) 的局部窗口之外,则忽略 (ˆi, ˆj ′ )。在训练期间,梯度不会通过σ 2 (ˆi) 反向传播。

3.6 实施细节

我们在 ScanNet 数据集上训练 LoFTR 的室内模型,在 MegaDepth 上训练室外模型 。在 ScanNet 上,使用 Adam 训练模型,初始学习率为 1 × 10−3,批处理大小为 64。在 64 个 GTX 1080Ti GPU 上训练 24 小时后,它会收敛。本地功能CNN使用ResNet-18 [12]的修改版本作为主干。整个模型使用随机初始化的权重进行端到端训练。Nc 设置为 4,Nf 为 1。θc 被选为 0.2。窗口大小 w 等于 5。F ̃A tr 和 F ̃B tr 在实现中通过精细级 LoFTR 之前,先对 F ̃A 和 F ̃B 进行上采样并连接。在RTX 2080Ti上,具有dualsoftmax匹配的完整型号在640×480图像对上的运行速度为116 ms。在最佳传输设置下,我们使用了三个 sinkhorn 迭代,模型以 130 毫秒的速度运行。我们建议读者参考补充材料,了解有关训练和时间分析的更多详细信息。

4. 实验

4.1 单调估计

  • 在第一个实验中,我们在广泛采用的 HPatches 数据集 上评估了 LoFTR 以进行单调估计。HPatches 包含 52 个在显著照明变化下的序列和 56 个在视点上表现出较大变化的序列。

  • 评估协议: 在每个测试序列中,一个参考图像与其余五个图像配对。所有图像的大小都调整为等于 480 的较短尺寸。对于每个图像对,我们提取一组在MegaDepth [21]上训练的LoFTR匹配项。我们使用 OpenCV 以 RANSAC 作为鲁棒估计器来计算单调估计。为了与产生不同匹配数量的方法进行公平的比较,我们计算了使用估计的 Hˆ 扭曲的图像与作为正确性标识符的真值 H 之间的角误差,如 [9] 所示。在 [37] 之后,我们报告了拐角误差的累积曲线下面积 (AUC),分别达到 3、5 和 10 像素的阈值。我们报告最多 1K 输出匹配的 LoFTR 结果。

  • 基线方法:我们将LoFTR与三类方法进行了比较:1)基于检测器的局部特征,包括R2D2 、D2Net和DISK ,2)基于检测器的局部特征匹配器,即SuperPoint 特征之上的SuperGlue ,以及3)无检测器匹配器,包括Sparse-NCNet [33]和DRC-Net 。对于局部特征,我们提取最多 2K 的特征,我们提取相互最近邻作为最终匹配项。对于直接输出匹配的方法,我们限制最多 1K 匹配,与 LoFTR 相同。我们在原始实现中对所有基线使用默认超参数
    在这里插入图片描述

  • 表 1 显示,在所有误差阈值下,LoFTR 明显优于其他基线。具体而言,LoFTR 与其他方法之间的性能差距随着更严格的正确性阈值而增加。我们将最佳性能归因于无探测器设计提供的更多匹配候选和Transformer带来的全局感受野。此外,从粗到细模块还通过将匹配细化到亚像素级别来提高估计精度

4.2. 相对姿态估计

  • 数据。我们使用 ScanNet 和 MegaDepth 分别在室内和室外场景中来证明 LoFTR 在姿态估计方面的有效性。

  • ScanNet 包含 1613 个单目序列,带有地面实况姿势和深度图。按照 SuperGlue 的程序,我们对 230M 图像对进行采样进行训练,重叠分数在 0.4 到 0.8 之间。我们在 [37] 的 1500 个测试对上评估了我们的方法。所有图像和深度图的大小都调整为 640 × 480。该数据集包含具有宽基线和广泛无纹理区域的图像对。

  • MegaDepth 由 196 个不同户外场景的 1M 互联网图像组成。作者还提供了COLMAP[40]的稀疏重建和从多视图立体计算的深度图。我们遵循DISK [47],仅使用“圣心大教堂”和“圣彼得广场”的场景进行验证,我们从中抽取了1500对进行公平比较。调整图像大小,使其较长的尺寸等于 840(用于训练)和 1200(用于验证)。MegaDepth 的主要挑战是在极端的视点变化和重复模式下进行匹配

  • 评估协议。在[37]之后,我们报告了阈值(5◦,10◦,20◦)处的姿态误差的AUC,其中姿态误差定义为旋转和平移中角度误差的最大值。为了恢复相机姿势,我们从与 RANSAC 的预测匹配中求解基本矩阵。由于缺少孔,我们没有比较 LoFTR 和其他基于探测器的方法之间的匹配精度为无检测器图像匹配方法定义的指标(例如,匹配分数或召回率 [13, 30])。我们认为DRCNet[19]是无探测器方法[34,33]中最先进的方法。
    在这里插入图片描述
    在这里插入图片描述

  • 室内姿态估计结果。与所有竞争对手相比,LoFTR 在姿势精度方面取得了最佳性能(见表 2 和图 5)。将 LoFTR 与最佳传输或双 softmax 配对作为可微分匹配层可实现相当的性能。由于DRC-Net†的已发布模型是在MegaDepth上训练的,因此我们提供了在MegaDepth上训练的LoFTR的结果†以便进行公平的比较。在本次评估中†LoFTR†也大大优于DRC-Net(见图5),这表明我们的模型在数据集中的泛化性。

  • 户外姿态估计结果。如表 3 所示,LoFTR 在 AUC@10° 时比无探测器方法 DRC-Net 性能高出 61%,证明了 Transformer 的有效性。对于 SuperGlue,我们使用开源本地化工具箱 HLoc [36] 中的设置。LoFTR的性能远远优于SuperGlue(AUC@10°时为13%),这证明了无探测器设计的有效性。与室内场景不同,LoFTR-DS在MegaDepth上的性能优于LoFTR-OT。更多的定性结果可以在图5中找到。

4.3. 视觉定位

  • 视觉定位。除了在相对姿态估计方面实现具有竞争力的性能外,LoFTR 还可以实现视觉定位,这是估计给定图像相对于相应 3D 场景模型的 6 自由度姿态的任务。我们在长期视觉定位基准[43](下文中称为VisLoc基准)上评估LoFTR。它侧重于对不同条件下的视觉定位方法进行基准测试,例如昼夜变化、场景几何变化以及具有大量无纹理区域的室内场景。因此,视觉定位任务依赖于高度稳健的图像匹配方法

  • 评估。我们在 VisLoc 的两条轨道上评估了 LoFTR,这些轨道包含几个挑战。首先,“手持设备的视觉定位”轨道需要完整的本地化管道。它基于两个数据集进行基准测试,即关于室外场景的AachenDay-Night数据集[38,54]和关于室内场景的InLoc [41]数据集。我们使用开源本地化管道 HLoc [36] 和 LoFTR 提取的匹配项。其次,“用于长期本地化的局部特征”轨道提供了一个固定的定位管道,用于评估局部特征提取器本身和匹配器(可选)。该跟踪使用亚琛 v1.1 数据集 [54]。我们在补充材料中提供了在 VisLoc 上测试 LoFTR 的实现细节。
    在这里插入图片描述

  • 结果。我们在表 4 和表 5 中提供了 LoFTR 的评估结果。我们已经评估了与最佳传输层或双软最大算子的 LoFTR 配对,并报告了结果更好的那个。LoFTR-DS 在局部特征挑战轨道中优于所有基线,显示出其在昼夜变化下的鲁棒性。然后,对于手持设备轨道的视觉定位,LoFTR-OT 在具有挑战性的 InLoc 数据集上优于所有已发布的方法,该数据集包含广泛的外观变化、更多无纹理区域、对称和重复元素。我们将这一突出性归因于Transformer和最佳传输层的使用,利用全球信息,共同将全球共识带入决赛。无探测器设计也起着关键作用,防止了基于探测器的方法在低纹理区域的可重复性问题。LoFTR-OT 在亚琛 v1.1 数据集的夜间查询中的表现与最先进的方法 SuperPoint + SuperGlue 相当,但在白天查询时表现稍差。

4.4. 了解 LoFTR

  • 消融研究。为了充分了解 LoFTR 中的不同模块,我们评估了五种不同的变体,结果如表 6 所示:1) 用具有相当数量的参数卷积替换 LoFTR 模块会导致 AUC 显着下降,正如预期的那样。2) 使用较小版本的 LoFTR,分别具有 1/16 和 1/4 分辨率的粗细级特征图,导致运行时间为 104 ms,姿态估计精度下降。3) 使用 DETR 风格的 [3] Transformer 架构,该架构在每层都有位置编码,导致结果明显下降。4) 通过将 LoFTR 层数增加一倍至 Nc = 8 和 Nf = 2 来增加模型容量几乎不会改变结果。我们使用与ScanNet上的室内姿态估计相同的训练和评估协议进行这些实验,并具有最佳传输层进行匹配。
  • 可视化注意力。我们在图 6 中可视化了注意力权重。
    在这里插入图片描述
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/353384.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

力扣hot100: 48. 旋转图像

LeetCode:48. 旋转图像 受到力扣hot100:54. 螺旋矩阵的启发,我们可以对旋转图像按层旋转,我们只需要记录四个顶点,并且本题是一个方阵,四个顶点就能完成图像的旋转操作。 1、逐层旋转 注意到&#xff0…

打造完美Mac多屏视界,BetterDisplay Pro一键掌控!

BetterDisplay Pro for Mac是一款专为Mac用户打造的显示器管理与优化软件,旨在为用户带来卓越的视觉体验和工作效率。它凭借强大的功能和简洁易用的界面,成为了Mac用户优化显示器设置的得力助手。 一、全方位管理与优化 BetterDisplay Pro for Mac支持…

0元体验苹果macOS系统,最简单的虚拟机部署macOS教程

前言 最近发现小伙伴热衷于在VMware上安装体验macOS系统,所以就有了今天的帖子。 正文开始 首先,鉴于小伙伴们热衷macOS,所以小白搜罗了一圈macOS系统,并开启了分享通道。 本次更新的系统版本是: macOS 10.13.6 ma…

LogicFlow 学习笔记——2. LogicFlow 基础 实例

LogicFlow 实例 创建实例 每一个流程设计界面&#xff0c;就是一个 LogicFlow 的实例。 <template><div id"container"></div><!-- 用于显示 LogicFlow 图表的容器 --> </template> <script>// 创建 LogicFlow 实例const lf …

YOLOv10改进 | 注意力篇 | YOLOv10引入Polarized Self-Attention注意力机制

1. Polarized Self-Attention介绍 1.1 摘要:像素级回归可能是细粒度计算机视觉任务中最常见的问题,例如估计关键点热图和分割掩模。 这些回归问题非常具有挑战性,特别是因为它们需要在低计算开销的情况下对高分辨率输入/输出的长期依赖性进行建模,以估计高度非线性的像素语…

什么洗地机好用又实惠?四大口碑优品推荐,超级火爆

作为一个家电工作者&#xff0c;近年来测评了不少洗地机&#xff0c;相对于传统的清洁习惯&#xff0c;即先扫地&#xff0c;再拖地&#xff0c;洗地机能够在一拖一拉之间&#xff0c;便完成地面上的清洁&#xff0c;而且人们也不用低头弯腰的去清洁&#xff0c;可谓是省时省力…

el-tree回显复选框时半选中和全选中的树

项目需求如下&#xff1a;当我点击“编辑”后&#xff0c;需要在tree树上全勾中和半勾中选项&#xff0c;由于后端接口返回的tree树是含了父级节点id的数组集合&#xff0c;所以我们回显时需要处理好这个全勾中和半勾中的问题。 主要思路如下&#xff0c;我们通过setData方法获…

专业学习|博弈论-博弈论概述

&#xff08;一&#xff09;认识博弈论&#xff1a;解析复杂决策与策略 &#xff08;1&#xff09;认识博弈 博弈论广泛应用于分析个体间因利益冲突而产生的决策问题。通过构建不同模型来探讨如经贸关系、军事威胁等问题&#xff0c;旨在寻找均衡解并提供新知&#xff0c;相较…

一个简单的信号发射电路的构建

在基本的信号发射电路中&#xff0c;线圈&#xff08;电感器&#xff09;和电阻的组合可以产生振荡信号&#xff0c;而天线&#xff08;通常通过线圈&#xff09;用于发射信号。 LC振荡电路&#xff1a; **线圈&#xff08;L1&#xff09;和电容器&#xff08;C&#xff09;**串…

【正则表达式】入门

参考视频&#xff1a;10分钟快速掌握正则表达式_哔哩哔哩_bilibili 这个网站用来测试写的正则表达式效果&#xff1a;regex101: build, test, and debug regex 示例&#xff1a; 限定符 ? 表示前一个字符可有可无 比如这里输入&#xff1a;de? 匹配结果可以得到d和de * 前…

SpringMVC—RequestMapping注解

一、RequestMapping注解 RequestMapping注解&#xff1a;是Spring MVC框架中的一个控制器映射注解&#xff0c;用于将请求映射到相应的处理方法上&#xff0c;具体来说&#xff0c;他可以将指定URL的请求绑定到一个特定的方法或类上&#xff0c;从而实现对请求的处理和响应。 …

线代的学习(矩阵)

1.矩阵的乘法 矩阵实现满足&#xff1a;内标相等 矩阵相乘之后的结果&#xff1a;前行后列 需要注意&#xff1a;1.矩阵的乘法不具有交换律&#xff1a;AB!BA 2.矩阵的乘法满足分配律&#xff1a;A(BC) AB AC 抽象逆矩阵求逆矩阵 方法1.凑定义法、 方法2.长除法 数字型矩阵…

SpringBoot快速入门-上

Apache Tomcat Apache Tomcat是一个开源的Servlet 或 web容器&#xff0c;它实现了Java Servlet、JavaServer Pages (JSP)、Java Unified Expression Language (JUEL) 和 Java WebSocket 规范。 使用 官网下载 安装:绿色版 , 直接解压 卸载:直接删除目录 改编码: # conf/l…

SpringCloudAlibaba组件集成

SpringCloudAlibaba组件集成 Nacos服务注册与发现 1.Nacos认识与安装 1.1.什么是Nacos Nacos和Eureka有着相同的能力&#xff0c;甚至更为强大&#xff0c;作为Dubbo 生态系统中重要的注册中心实现。官方对它有如下定义&#xff1a; Nacos致力于帮助您发现&#xff0c;配置…

kettle从入门到精通 第七十一课 ETL之kettle 再谈http post,轻松掌握body中传递json参数

场景&#xff1a; kettle中http post步骤如何发送http请求且传递body参数&#xff1f; 解决方案&#xff1a; http post步骤中直接设置Request entity field字段即可。 1、手边没有现成的post接口&#xff0c;索性用python搭建一个简单的接口&#xff0c;关键代码如下&#…

JCR一区 | Matlab实现GAF-PCNN、GASF-CNN、GADF-CNN的多特征输入数据分类预测/故障诊断

JJCR一区 | Matlab实现GAF-PCNN、GASF-CNN、GADF-CNN的多特征输入数据分类预测/故障诊断 目录 JJCR一区 | Matlab实现GAF-PCNN、GASF-CNN、GADF-CNN的多特征输入数据分类预测/故障诊断分类效果格拉姆矩阵图GAF-PCNNGASF-CNNGADF-CNN 基本介绍程序设计参考资料 分类效果 格拉姆…

NVIDIA新模型Nemotron-4:98%的训练数据是合成生成的,你敢信?

获取本文论文原文PDF&#xff0c;请公众号 AI论文解读 留言&#xff1a;论文解读 标题&#xff1a;Nemotron-4 340B Technical Report 模型概述&#xff1a;Nemotron-4 340B系列模型的基本构成 Nemotron-4 340B系列模型包括三个主要版本&#xff1a;Nemotron-4-340B-Base、…

序列化与反序列化漏洞实例

实验环境&#xff1a; 本次的序列化与反序列化漏洞为2021年强网杯上的一道比赛题目&#xff0c;我使用phpstudy集成环境将其测试环境搭建在了本地&#xff0c;如下。涉及的几个页面php为&#xff1a; index.php function.php myclass.php index.php : <?php // inde…

二叉树、二叉查找树、平衡二叉树及各种旋转机制

二叉树 大体构型&#xff1a; 树里每个结点存储的有&#xff1a;所有树都是这样 二叉树的度&#xff1a;任意节点度<2 二叉树的属性&#xff1a; 二叉树的遍历顺序&#xff1a; 前&#xff1a; 中&#xff1a; 后&#xff1a; 二叉查找树&#xff1a;每个节点最多2子节点&…

最新Prompt预设词分享,DALL-E3文生图+文档分析

使用指南 直接复制使用 可以前往已经添加好Prompt预设的AI系统测试使用&#xff08;可自定义添加使用&#xff09; 支持GPTs SparkAi SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统&#xff0c;支持OpenAI-GPT全模型国内AI全模型。支持GPT-4o…