论文阅读【检测】：Facebook ECCV2020 | DETR

论文阅读【检测】：Facebook ECCV2020 | DETR

news/2024/12/25 12:44:20/文章来源:https://blog.csdn.net/qq_17614495/article/details/140657032

文章目录

- 论文地址
- Abstract
- Motivation
- 模型框架
- 详细结构
- 小结

论文地址

DETR

Abstract

提出了一种将目标检测视为直接集预测问题的新方法。简化了检测pipeline，有效地消除了许多手工设计的组件的需求，例如非最大抑制过程或锚生成，这些组件明确地编码了任务的先验知识。新框架的主要成分，是基于集合的全局损失，它通过二部匹配强制唯一的预测，以及变transformer encoder-decoder架构。给定一组固定的学习对象查询，DETR 推理对象和全局图像上下文的关系，以并行直接输出最终的预测集。DETR在具有挑战性的COCO对象检测数据集上展示了与成熟和高度优化的Faster RCNN基线相当的准确性和运行时性能。

Motivation

通常检测器通过在proposal、anchor 或center point 上定义代理回归和分类问题，以间接方式解决该集合预测任务。它们的性能受到后处理步骤、锚集的设计以及将目标框分配给锚的启发式方法显着影响。为了简化这些pipeline，所以提出了一种直接集预测方法来绕过代理任务。

模型框架

从论文图中可以看出，整个pipeline确实很简单。
在这里插入图片描述

详细结构

图像先经过下采样，用小的feature map输入transformer结构中，必然导致了对小目标检测效果较差。论文中也明确说了这个问题。 初始化的queries为0, 同时position embedding 每个模块都要加一次
在这里插入图片描述
Encoder

Decoder

小结

确实简化都不少手工设计的组建，但是在小目标的表现上较差。NMS感觉还是需要的，不可能刚刚好一个目标对应预测一个框。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/383523.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

802.11无线网络权威指南（二）：无线帧结构

802.11无线网络权威指南（二）：无线帧结构

802.11无线网络权威指南（二）：无线帧结构无线协议桢的三种类型无线网络帧结构完整帧格式control frameDuration/IDAddressSequence ControlQoS ControlHT Control 字段Frame Body 帧体FCS 校验域帧细节管理帧控制帧RTS 帧CTS 帧ACK 帧格式PS…

阅读更多...

ceph log内容解析

ceph log内容解析

log内容构造如osd的一条log 分别表示时间戳线程id 日志等级子模块内容实体剖析源码实现每条log都是由一个Entry构成定义在src/log/entry.h中 Entry(short pr, short sub) :m_stamp(clock().now()), // 打印日志时的时间戳m_thread(pthread_self()), // 打印日志的线…

阅读更多...

redis的持久化方式

redis的持久化方式

目录 1. 什么是持久化？ 2. redis实现持久化的方式 2.1 什么是RDB？ 2.2 什么时候会触发RDB模式？ 2.2.1 手动触发 2.2.2 自动触发 2.3 什么是Aof？ 2.3.1 开启Aof 2.4 RBD和AOF的区别 1. 什么是持久化？ 把内存中…

阅读更多...

el-table列的显示与隐藏

el-table列的显示与隐藏

需求：实现表字段的显示与隐藏。效果图代码实现写在前面首先我部分字段有自定义的排序逻辑，和默认值或者数据的计算所以是不能简单的使用 v-for 循环column 。然后我需要默认展示一部分字段，并且当表无数据时提示不能显示隐藏 …

阅读更多...

AIGC Kolors可图IP-Adapter-Plus风格参考模型使用案例

AIGC Kolors可图IP-Adapter-Plus风格参考模型使用案例

参考： https://huggingface.co/Kwai-Kolors/Kolors-IP-Adapter-Plus 代码环境安装： git clone https://github.com/Kwai-Kolors/Kolors cd Kolors conda create --name kolors python=3.8 conda activate kolors pip install -r requirements.txt python3 setup.py install…

阅读更多...

mybatis一对多多对多

mybatis一对多多对多

一对一方式一: ,在result的property属性用user.XXX 方式二:把user对象的属性用resultMap标签包含在association标签里,user的id做id标签,特点是返回值是对象的标识,而集合是collection 一对多在user类加了个订单的集合,表示一个用户有多个订单这接口当然是user的分为re…

阅读更多...

PWM信号转模拟信号转换器GP8101/GP8101M

PWM信号转模拟信号转换器GP8101/GP8101M

前言： 各位大佬，听说过PAC吗？PAC (PWM to Analog Converter)。今天介绍一个小众的转换芯片，PWM转模拟信号的，有一定的应用场景,单价一元多。这种芯片隔离PWM还是很容易的。 0%-100% PWM to 0-5V/0-10V SOP8封装的GP…

阅读更多...

HarmonyOS三方库的使用

HarmonyOS三方库的使用

系统组件难以提供比较优秀的界面，需要第三方库来实现一些比较好看的界面效果三方库的获取： 开源社区支持OpenHarmony-TPC 和 Openharmony三方库中心仓先目前已经拥有各种各样的三方库，包括UI 图片动画网络数据存储工具类多媒体安全等…

阅读更多...

redis数据类型介绍

redis数据类型介绍

Redis 支持多种数据类型，包括： 1.字符串（String）：最简单的数据类型，可以存储字符串、数字等。 2.哈希（Hash）：类似于 Map，可以存储键值对，其中键值…

阅读更多...

Go语言编程学习笔记整理第2章顺序编程后半部分

Go语言编程学习笔记整理第2章顺序编程后半部分

1.流程控制 1.1 条件语句 if a < 5 { return 0 } else { return 1 } 注意：在有返回值的函数中，不允许将“最终的”return语句包含在if...else...结构中， 否则会编译失败！！！ func example(x int) i…

阅读更多...

leetcode 2236.判断根节点是否等于字节点

leetcode 2236.判断根节点是否等于字节点

1.题目要求: 给你一个二叉树的根结点 root，该二叉树由恰好 3 个结点组成：根结点、左子结点和右子结点。如果根结点值等于两个子结点值之和，返回 true ，否则返回 false 。2.思路: 直接数组前序遍历，然后判断后面两个…

阅读更多...

【C++】：红黑树深度剖析 --- 手撕红黑树！

【C++】：红黑树深度剖析 --- 手撕红黑树！

目录前言一，红黑树的概念二，红黑树的性质三，红黑树节点的定义四，红黑树的插入操作4.1 第一步4.2 第二步4.3 插入操作的完整代码五，红黑树的验证六，实现红黑树的完整代码五，红黑树与AVL树的比较…

阅读更多...

【接口自动化_08课_Pytest+Yaml+Allure框架】

【接口自动化_08课_Pytest+Yaml+Allure框架】

上节课一些内容的补充 1、openxl这个方法，第一个元素是从1开始的，不是从0开始回写的列在程序里写的是11，是因为是固定值一、1. Yaml入门及应用 1、什么是yaml YAML（/ˈjməl/，尾音类似camel骆驼）是一…

阅读更多...

单向链表

单向链表

目录思维导图： 学习内容： 1. 链表的引入 1.1 顺序表的优缺点 1.1.1 优点 1.1.2 不足 1.1.3 缺点 1.2 链表的概念 1.2.1 链式存储的线性表叫做链表 1.2.2 链表的基础概念 1.3 链表的分类 2. 单向链表 2.1 节点结构体类型 2.2 创建链表 2.…

阅读更多...

EXCEL 排名(RANK,COUNTIFS)

EXCEL 排名(RANK,COUNTIFS)

1.单列排序需求描述：如有下面表格，需要按笔试成绩整体排名。解决步骤： 我们使用RANK函数即可实现单列整体排名。 Number 选择第一列。 Ref 选择这一整列（CtrlShift向下箭头、再按F4）。 "确定"即可计算…

阅读更多...

图像分类算法概述：深度学习方法

图像分类算法概述：深度学习方法

图像分类算法概述：深度学习方法图像分类是计算机视觉中的一个基本任务，近年来随着深度学习的发展，图像分类算法取得了巨大的进步。本文将概述主要的深度学习图像分类算法。 #mermaid-svg-fkTtkPLl9ahuVT6w {font-family:"trebuchet ms…

阅读更多...

BGP选路之Preferred value

BGP选路之Preferred value

原理概述当一台BGP路由器中存在多条去往同一目标网络的BGP路由时，BGP协议会对这些BGP路由的属性进行比较，以确定去往该目标网络的最优BGP路由，然后将该最优BGP路由与去往同一目标网络的其他协议路由进行比较，从而决定是否将该最优…

阅读更多...

元组(tuple)

元组(tuple)

目录一、基本介绍 1、元组(tuple)可以存放多个不同数据类型，元组是不可变序列 2、元组也是一种数据类型二、元组的定义 1、元组的定义 2、代码说明三、元组的使用 1、元组使用语法 2、举例说明 3、代码演示，访问/获取第三个数据/元素四、…

阅读更多...

SpringBoot集成Kaptcha验证码

SpringBoot集成Kaptcha验证码

Hi 👋, Im shy 有人见尘埃，有人见星辰 1. 什么是Kaptcha验证码? Kaptcha是一个强大的开源Java验证码生成库,由Google开发。它能够生成高度可配置的图片验证码,主要用于防止自动化程序滥用web应用,提高应用的安全性。 2. Kaptcha的主要特性 Kaptch…

阅读更多...

AMEsim液压阀伯德图绘制方法

AMEsim液压阀伯德图绘制方法

之前也在液压圈论坛里面发过类似的贴子，具体可以看这个网址🚪👉：如何得出说明书里面的伯德图曲线？，回复的人还是比较少，这个方法重要信息是参考百度文库这篇文章🚪👉&…

阅读更多...

最新文章

推荐文章