透视单目DETR 2D
透视单目DETR 2D的。对于DETR系列消除了 NMS的2D目标检测,RT-DETR[8]设计了一个高效的混合编码器,通过解耦尺度内交互和跨尺度融合来提高速度。采用不确定性最小查询选择,为解码器提供高质量的初始查询,从而提高准确率。
透视单目3D
透视单目3D。MonoCD[1]提出了交叉互补的深度估计方案,回归头分为两部分:局部线索和全局线索。局部线索分支根据预测的 Heatmap 为每个局部峰值点估计维度、关键点、直接深度、方向和 2D 检测。全局线索分支根据所有提取的像素特征预测整个图像的 Horizon Heatmap,用于获得场景中 y g l o y_{glo} y