(14)D-FINE网络,爆锤yolo系列

yolo过时了?传统的yolo算法在小目标检测方面总是不行,最新算法DEIM爆锤yolo,已经替yolo解决。
在这里插入图片描述

一、创新点

​ 这个算法名为DEIM,全称是DETR with Improved Matching for Fast Convergence,其主要创新点在于提出了一种新的训练框架,用于加速基于Transformer架构(如DETR)的实时目标检测模型的收敛。具体来说,DEIM的创新点包括:

  1. Dense O2O Matching(密集一对一匹配)

    • DEIM采用了一种新的匹配策略,称为Dense O2O(密集一对一匹配),这种策略通过在每个训练图像中增加更多的目标来增加正样本的数量,从而提供更密集的监督信号,加速模型的收敛。
    • 使用标准的图像增强技术(如mosaic和mixup)来增加每个图像中的目标数量,同时保持一对一匹配框架不变。
  2. Matchability-Aware Loss (MAL)(匹配能力感知损失)

    • 为了解决Dense O2O匹配引入的大量低质量匹配问题,DEIM提出了一种新的损失函数MAL,该函数根据匹配质量(通过IoU和分类置信度的结合)来调整惩罚,优化不同质量水平的匹配。

    • MAL对于高置信度的低质量匹配给予了更大的惩罚,提高了有限正样本的效用,并简化了数学公式。

MAL的公式如下:

M A L ( p , q , y ) = { − q γ log ⁡ ( p ) + ( 1 − q γ ) log ⁡ ( 1 − p ) if  y = 1 − p γ log ⁡ ( 1 − p ) if  y = 0 MAL(p, q, y) = \begin{cases} -q^\gamma \log(p) + (1 - q^\gamma) \log(1 - p) & \text{if } y = 1 \\ -p^\gamma \log(1 - p) & \text{if } y = 0 \end{cases} MAL(p,q,y)={qγlog(p)+(1qγ)log(1p)pγlog(1p)if y=1if y=0
其中:

  • p表示预测框属于前景类别的概率。
  • q表示预测框与真实框之间的IoU值。
  • y是真实标签,1表示前景,0表示背景。
  • γ \gamma γ 是一个参数,用于平衡易例和难例之间的关注程度。

二、提升点

与YOLOv11相比,DEIM在以下几个指标上取得了提升:

  1. 收敛速度

    • DEIM显著加快了RT-DETRv2和D-FINE模型的收敛速度,使得这些模型在较少的训练周期内就能达到与YOLOv11相当的性能。
  2. 平均精度(AP)

    • 在COCO数据集上,DEIM与RT-DETRv2结合时,在一天的训练后(使用NVIDIA 4090 GPU)达到了53.2%的AP,显示出在精度上的显著提升。
  3. 实时性能

    • DEIM训练的实时模型在NVIDIA T4 GPU上达到了54.7%和56.5%的AP,分别在124和78 FPS的帧率下,无需额外数据,这表明DEIM在实时目标检测任务中具有更好的性能。
  4. 小目标检测

    • DEIM在小目标检测方面也显示出了优势,尽管与某些YOLO模型相比在小目标AP上略有下降,但总体AP更高,显示出DEIM在整体性能上的提升。

​ 总的来说,DEIM通过改进匹配策略和损失函数,提高了模型的训练效率和检测性能,特别是在实时目标检测领域,DEIM为提高目标检测的速度和准确性提供了一种有效的解决方案。

三、往期回顾

​ yolo入门教程:《吐血录制,yolo11猫狗实时检测实战项目,从零开始写yolov11代码》,视频全程25分钟。

在这里插入图片描述

(1)yolo11猫狗实时检测实战项目,从零开始写yolov11代码

(2)从零开始学yolo之yolov1的技术原理

(3)YOLOv1训练过程,新手入门

(4)YOLOv2和yolov1的差异

(5)YOLOv3和yolov1、yolov2之间的差异

(6)YOLOv4算法基本原理以及和YOLOv3 的差异

(7)YOLOv5算法基本原理大揭秘!

(8)YOLOv6算法基本原理

(9)YOLOv7算法基本原理

(10)YOLOv8算法基本原理

(11)YOLOv9算法基本原理

(12)YOLOv10算法基本原理

(13)10张结构图,深入理解YOLOv11算法各个模块

高清视频,3分钟揭秘神经网络技术原理

在这里插入图片描述
Transfermer的Q、K、V设计的底层逻辑

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/493582.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

日本充电桩标准--CHAdeMO介绍

一、日本充电桩标准 1、充电桩认证体系 日本是新能源汽车主要推动者之一,其实相比纯电动车来说,在日本混动或者插电混动更受到民众的欢迎,油耗低经济实用比纯电动车更方便,连服务类的出租车和警车也大多都采用混动车型。在日本充…

HDR视频技术之十:MPEG 及 VCEG 的 HDR 编码优化

与传统标准动态范围( SDR)视频相比,高动态范围( HDR)视频由于比特深度的增加提供了更加丰富的亮区细节和暗区细节。最新的显示技术通过清晰地再现 HDR 视频内容使得为用户提供身临其境的观看体验成为可能。面对目前日益…

web实验三

web实验三 三四个小时左右吧&#xff0c;做成功了学到新东西了&#xff0c;还是挺有趣的&#xff0c;好玩。还有些功能没做完&#xff0c;暂时这样了&#xff0c;要交了。 html <!DOCTYPE html> <html lang"en"><head><meta charset"UTF…

VUE3+django接口自动化部署平台部署说明文档(使用说明,需要私信)

网址连接&#xff1a;http://118.25.110.213:5200/#/login 账号/密码&#xff1a;renxiaoyong 1、VUE3部署本地。 1.1本地安装部署node.js 1.2安装vue脚手架 npm install -g vue/cli # 或者 yarn global add vue/cli1.3创建本地项目 vue create my-vue-project1.4安装依赖和插…

C++ 智能指针(高频面试题)

本篇文章来介绍一下C高频面试题 智能指针。 1.智能指针高频问题&#xff1a; 接下来我会为大家一 一解读&#xff1a; 2.智能指针的由来&#xff1a; 在实际开发中 遇到的困境&#xff1a; 3.智能指针的核心是采用RAII思想来自动化管理指针指向的动态资源的释放&#xff08;…

Leetcode Hot 100 【二叉树】104. 二叉树的最大深度

104. 二叉树的最大深度 已解答 简单 相关标签 相关企业 给定一个二叉树 root &#xff0c;返回其最大深度。 二叉树的 最大深度 是指从根节点到最远叶子节点的最长路径上的节点数。 示例 1&#xff1a; 输入&#xff1a;root [3,9,20,null,null,15,7] 输出&#xff1a;3…

Connecting to Oracle 11g Database in Python

# encoding: utf-8 # 版权所有 2024 涂聚文有限公司 # 许可信息查看&#xff1a;言語成了邀功盡責的功臣&#xff0c;還需要行爲每日來值班嗎 # 描述&#xff1a;python -m pip install oracledb # python -m pip install cx_Oracle --upgrade # pip install cx_Oracle # Autho…

UE5喷涂功能

许多FPS/TPS 游戏都有喷涂、涂鸦功能 其实原理很简单&#xff0c;就是利用了延迟贴花实现的 我们从网上随便找一张图 创建一个材质&#xff0c;材质域选择延迟贴花 混合模式选择半透明&#xff0c;自发光强度可以看感觉调整 材质做好之后编译保存&#xff0c;新建一个Actor…

PCL点云库入门——PCL库中点云数据拓扑关系之K-D树(KDtree)

1、点云的拓扑邻域 在三维空间数据处理的领域中&#xff0c;点云的邻域概念显得尤为关键&#xff0c;它不仅链接了点云数据之间的拓扑结构&#xff0c;而且在构建点云间的拓扑关系时起到了桥梁的作用。这种关系的建立&#xff0c;使得我们能够以一种高效、迅速的方式管理庞大的…

【bodgeito】攻防实战记录

也许有一天我们再相逢&#xff0c;睁开眼睛看清楚&#xff0c;我才是英雄。 进入网站整体浏览网页 点击页面评分进入关卡 一般搭建之后这里都是红色的&#xff0c;黄色是代表接近&#xff0c;绿色代表过关 首先来到搜索处本着见框就插的原则 构造payload输入 <script>…

【1.排序】

排序 笔记记录 1.排序的基本概念1.1 排序的定义 2. 插入排序2.1 直接插入排序2.2 折半插入排序2.3 希尔排序 3. 交换排序3.1 冒泡排序3.2 快速排序 4. 选择排序4.1 简单选择排序4.2 堆排序 5. 归并排序、基数排序和计数排序5.1 归并排序4.2 基数排序4.3 计数排序 6. 各种内部排…

杂七杂八的网络安全知识

一、信息安全概述 1.信息与信息安全 信息与信息技术 信息奠基人&#xff1a;香农&#xff1a;信息是用来消除随机不确定性的东西 信息的定义&#xff1a;信息是有意义的数据&#xff0c;是一种要适当保护的资产。数据经过加工处理之后&#xff0c;就成为信息。而信息需要经…

Loki 微服务模式组件介绍

目录 一、简介 二、架构图 三、组件介绍 Distributor&#xff08;分发器&#xff09; Ingester&#xff08;存储器&#xff09; Querier&#xff08;查询器&#xff09; Query Frontend&#xff08;查询前端&#xff09; Index Gateway&#xff08;索引网关&#xff09…

基于LabVIEW的USRP信道测量开发

随着无线通信技术的不断发展&#xff0c;基于软件无线电的设备&#xff08;如USRP&#xff09;在信道测量、无线通信测试等领域扮演着重要角色。通过LabVIEW与USRP的结合&#xff0c;开发者可以实现信号生成、接收及信道估计等功能。尽管LabVIEW提供了丰富的信号处理工具和图形…

STM32-笔记5-按键点灯(中断方法)

1、复制03-流水灯项目&#xff0c;重命名06-按键点灯&#xff08;中断法&#xff09; 在\Drivers\BSP目录下创建一个文件夹exti&#xff0c;在该文件夹下&#xff0c;创建两个文件exti.c和exti.h文件&#xff0c;并且把这两个文件加载到项目中&#xff0c;打开项目工程文件 加载…

windwos defender实现白名单效果(除了指定应用或端口其它一律禁止)禁止服务器上网

一、应用场景说明 当我们的一台windows服务器中毒&#xff0c;变成别人肉鸡&#xff0c;不断向外请示非法网站或攻击其它服务器。 要彻底清除相关木马或病毒往往需要的时间比较长&#xff0c;比较有效的方法是禁止服务器主动向外发包除了网站端口和远程程序除外。 其实这就是一…

【AI学习】Huggingface复刻Test-time Compute Scaling技术

OpenAI ChatGPT o1 背后的关键技术Test-time Compute Scaling&#xff0c;Huggingface实现并开源了&#xff01; Hugging Face 团队发布了一篇关于“开源模型中的推理阶段计算扩展”&#xff08;Test-time Compute Scaling&#xff09; 的研究文章。Hugging Face 团队通过复现…

Word图片嵌入格式不正确的解决办法

问题描述: 如图, 粘贴到word的图片只显示底部一部分 解决方法: 第一步 先将图片嵌入文本行中 第二步 再将图片设置为正文格式 然后就出来了

【活动邀请·深圳】深圳COC社区 深圳 AWS UG 2024 re:Invent re:Cap

re:Invent 是全球云计算领域的顶级盛会&#xff0c;每年都会吸引来自世界各地的技术领袖、创新者和实践者汇聚一堂&#xff0c;分享最新的技术成果和创新实践&#xff0c;深圳 UG 作为亚马逊云科技技术社区的重要组成部分&#xff0c;将借助 re:Invent 的东风&#xff0c;举办此…

Intel-ECI之Codesys PLC + Ethercat 远端IO + Codesys IDE编程

目录 一、 准备工作 二、安装Codesys 软件 PLC 三、 使用Codesys IDE 编程测试 CODESYS* 是领先的独立于制造商的 IEC 61131-3 自动化软件&#xff0c;适用于工程控制系统。它用于 Intel Edge Controls for Industrial&#xff08;Intel ECI 或 ECI&#xff09;&#xff0c;…