【目标跟踪】DUT Anti-UAV数据集详细介绍

        DUT Anti-UAV数据集是大连理工大学的团队公开的数据集(DUT是他们学校的简称),其中包括了两个子数据集:目标检测和目标跟踪(也就是说,目标检测和目标跟踪都可以用这个数据集)。该数据集为可见光模式的数据集,博主之前介绍的数据集中,Anti-UAV410【目标跟踪】AntiUAV410数据集详细介绍_antiuav数据集双模态-CSDN博客和Anti-UAV600【目标跟踪】AntiUAV600数据集详细介绍-CSDN博客都是红外模式的数据集,Anti-UAV【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客是双模数据集。

论文链接:[2205.10851] Vision-based Anti-UAV Detection and Trackingicon-default.png?t=O83Ahttps://arxiv.org/abs/2205.10851

数据集链接:wangdongdut/DUT-Anti-UAVicon-default.png?t=O83Ahttps://github.com/wangdongdut/DUT-Anti-UAV?tab=readme-ov-file

目录

1、Introduction概论

2、Dataset splitting(数据分割)

3、Dataset characteristics(数据特征)

(1)Image resolution

(2)Object and background

(3)Object scale

(4)Object aspect ratio

(5)Object position

4、Dataset challenges(数据挑战)


1、Introduction概论

        论文作者提出,为了帮助UAV的检测和跟踪的发展,提出了DUT Anti-UAV数据集,该数据集包含检测和跟踪的子集。检测数据集被分为三个子集,包括训练集(training)、测试集(testing)、验证集(verification)。跟踪数据集包含20个目标为UAV的序列

        与其他已有的数据集对比,论文作者团队提出的DUT Anti-UAV数据集中,无人机的分布较为分散,水平和垂直分布相对更加均匀,这使得使用该数据集训练的模型更加鲁棒。同时,收集的数据大多是在建筑物较多的地方,更适合民用

2、Dataset splitting(数据分割)

        检测数据集被分为训练集、测试集和验证集;跟踪数据集包含20个长短序列。所有的图像帧都进行了详细的手工标注。下表为该数据集的各项属性的详细介绍。

检测数据集共包含10000张图像,训练集包含5200张,测试集包含2200张,验证集包含2600张, 每张图像中不只包含一个检测目标,因此整个检测数据集中包含10109个检测目标,训练姐包含5243个,测试集包含2245个,验证集包含2621个。

3、Dataset characteristics(数据特征)

        相较于其他传统的目标检测和目标跟踪的数据集(如COCO、ILSVRC、LaSOT、OTB等),DUT Anti-UAV数据集最突出的特点就是小目标的比例大大增加。此外,无人机通常都是在室外飞行,背景是十分复杂的。

(1)Image resolution

        DUT Anti-UAV数据集包含了不同分辨率的图像(跟之前将的数据集的不同之处):对于目标检测数据集,最大的图像尺寸为3744*5616,而最小的图像尺寸为160*240;对于目标跟踪数据集,有两种分辨率的视频,分别为1080*1920和720*1280。图像分辨率的不同设置可以使模型适应不同大小的图像,避免过拟合

(2)Object and background

        使用好的数据集来训练模型可以很好地提高模型的性能,论文作者团队为了提高数据集的多样性,使用了超过35种无人机,如下图。

提到多样性肯定就离不开各种各样的飞行背景了,DUT Anti-UAV数据集中的飞行背景包括天空、乌云、草丛、高耸的建筑、居民区、农场等,同时光线条件也是随机变换(白天、夜晚、黄昏和清晨;晴天,阴天和雨雪天),如下图所示。

(3)Object scale

        无人机通常都是小尺寸目标,下图是目标尺寸与全图尺寸的面积比所绘制的散点图。(图像很直观了,这里我就不过多讲了)

与传统数据集比较,小目标的检测和跟踪更有挑战性,也更容易失败。(所以现在小目标的检测和跟踪还是有很多东西值得俺们深入研究) 

(4)Object aspect ratio

        下图是数据集中目标的长宽比的直方图,能很明显看出同一个序列中长宽比有较大的变化。(也属于数据多样性的一部分吧)

(5)Object position

        论文中以散点图的形式描述了物体相对中心位置的位置分布。大部分物体都集中在图像的中心。所有集合中物体的运动范围各不相同,物体的水平运动和垂直运动分布均匀。对于跟踪数据集,目标在一个序列中的边界框是连续的。下图中的 ( d )还展示了——除了图像的中心区域,物体还频繁地向图像的右边和左下方移动

4、Dataset challenges(数据挑战)

        通过上文的分析(还有之前几篇数据集的博客),能够很清晰地整明白UAV检测和跟踪的困难和挑战在哪里。首先就是UAV本身就是一个小目标,如果景复杂且有较为相似的物体,识别和跟踪的难度就会大大增加;其次,光线的强弱也会有影响,因为UAV的外观不尽相同,光线的不同也会对识别和跟踪造成较大的影响;然后就是之前的博客提到的相通的问题——模糊、快速移动、消失、遮挡等。下面的两组图就能很好的展示上述的问题(图片来自与DUT Anti-UAV数据集)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/484600.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

青岛鼎信Java开发面试题及参考答案

MySQL 的事务特性有哪些? MySQL 事务具有四个重要特性,被称为 ACID 特性。 原子性(Atomicity):事务是一个不可分割的工作单位,事务中的操作要么全部执行,要么全部不执行。例如,在银行…

【机器学习】分类器

在机器学习(Machine Learning,ML)中,分类器泛指算法或模型,用于将输入数据分为不同的类别或标签。分类器是监督学习的一部分,它依据已知的数据集中的特征和标签进行训练,并根据这些学习到的知识对新的未标记数据进行分…

[软件开发幼稚指数评比]《软件方法》自测题解析010

第1章自测题 Part2 **9 [**单选题] 以下说法和其他三个最不类似的是: A)如果允许一次走两步,新手也能击败象棋大师 B)百米短跑比赛才10秒钟,不可能为每一秒做周密计划,凭感觉跑就是 C)即使是最好的足球队,也不能保证每…

解决 PyTorch 中的 AttributeError: ‘NoneType‘ object has no attribute ‘reshape‘ 错误

这里写目录标题 一、错误分析二、错误原因三、解决方案1. 检查损失函数2. 检查前向传播3. 检查 backward 函数4. 检查梯度传递 四、前向传播与反向传播1. 前向传播2. 反向传播3. 自定义 backward 函数示例反向传播过程:常见的错误:1:损失函数…

【AI系统】推理参数

推理参数 本文将介绍 AI 模型网络参数方面的一些基本概念,以及硬件相关的性能指标,为后面让大家更了解模型轻量化做初步准备。值得让人思考的是,随着深度学习的发展,神经网络被广泛应用于各种领域,模型性能的提高同时…

devops-Dockerfile+Jenkinsfile方式部署Java前后端应用

文章目录 概述部署前端Vue应用一、环境准备1、Dockerfile2、.dockerignore3、nginx.conf4、Jenkinsfile 二、Jenkins部署1、新建任务2、流水线3、Build Now 构建 & 访问 Springboot后端应用1. 准备工作2. 创建项目结构3. 编写 Dockerfile后端 Dockerfile (backend/Dockerfi…

【时时三省】(C语言基础)结构体的变量定义和初始化

山不在高,有仙则名。水不在深,有龙则灵。 ----CSDN 时时三省 有了结构体类型,那如果定义变量,其实很简单。 示例: 这个就是结构体变量的基础创建 初始化 比如里面只剩一个s3 s3里面有两个成员 第一个给c的值 第二个给…

社群分享在商业引流与职业转型中的作用:开源 AI 智能名片 2+1 链动模式小程序的应用契机

摘要:本文聚焦于社群分享在商业领域的重要性,阐述其作为干货诱饵在引流方面的关键意义。详细探讨了提供有价值干货的多种方式,包括文字分享、问题解答以及直播分享等,并分析了直播分享所需的条件。同时,以自身经历为例…

Python毕业设计选题:基于协同过滤的动漫推荐系统设计与实现_django+hive+spider

开发语言:Python框架:djangoPython版本:python3.7.7数据库:mysql 5.7数据库工具:Navicat11开发软件:PyCharm 系统展示 管理员登录 管理员功能界面 用户管理 动漫数据 看板展示 论坛交流 系统管理 用户功能…

Python批量生成个性化Word录用通知书

你是一名人力资源部门的员工,你需要根据一份Excel表格中的员工信息,为每位员工生成一份录用通知书。 Excel表格中包含了员工的姓名、性别、职位、入职日期等信息,你需要将这些信息填充到Word模板中,并生成独立的录用通知书文件。…

第1章 敏捷的基本概念

1.区分:敏捷、精益和看板方法 敏捷既可以说成是一种思维,也可以说是一种方法,它旨在项目推进的过程中,帮助团队提高效率,但除了敏捷,精益思想和看板方法也能够提高效率。   敏捷方法和看板方法都是面向组织级的&…

OpenHarmony中HDC相关操作源码

目录 一.背景 二.文件路径 三.相关指令位置 一.背景 本次主要记录OpenHarmony中的HDC相关操作的源码位置,为后续有hdc相关修改可以进行快速的查询 二.文件路径 首先找到hdc相关的代码逻辑模块位置,路径:xxx\developtools\hdc 如果想干掉hdc的所有功能,就是如下的patch d…

校企合作新模式:校招管理系统促进企业人才供需精准对接

近年来,随着高校毕业生就业形势的日益严峻,校企合作作为一种有效的人才培养模式,越来越受到社会各界的广泛关注。然而,传统的校企合作模式往往存在信息传递不畅、供需不匹配等问题,导致企业难以招到合适的人才&#xf…

【清华】世界模型综述:理解世界还是预测未来?

论文:https://arxiv.org/pdf/2411.14499 1. 引言 1.1 研究背景与意义 世界模型(World Models)的概念随着人工智能领域,尤其是多模态大型语言模型和视频生成模型的快速发展而受到广泛关注。这些模型被视为实现人工通用智能(AGI…

排序2(万字详细版)

一 快速排序 快速排序是Hoare于1962年提出的⼀种⼆叉树结构的交换排序⽅法,其基本思想为:任取待排序元素 序列中的某元素作为基准值,按照该排序码将待排序集合分割成两⼦序列,左⼦序列中所有元素均⼩ 于基准值,右⼦序列…

智能交通(8)——腾讯开悟智能交通信号灯调度赛道

本文档用于记录参加腾讯开悟智能信号灯调度赛道的模型优化过程。官方提供了dqn和target_dqn算法,模型的优化在官方提供的代码基础上进行。最终排名是在榜单16,没能进入最后的决赛。 一.赛题介绍 赛题简介:在本地赛题中,参赛团队…

抖音矩阵系统快速部署指南/抖音矩阵系统源码分发,短视频矩阵账号管理系统开发部署—

抖音矩阵系统的源码分发与短视频账号管理平台的开发部署,要求通过对接官方API来实现功能的拓展。当前开发的账号矩阵管理系统专注于提供一键式管理多个账户的能力,支持定时发布内容、自动化关键词生成以实现搜索引擎优化(SEO)和霸…

社群借势与 AI 智能名片微信小程序的融合应用与发展策略

摘要:本文探讨了在社群运营中借势策略的运用,包括通过联谊活动和互换用户在不同社群间实现资源整合与协同发展。同时,引入 AI 智能名片微信小程序这一新兴工具,分析其在社群运营借势过程中的独特作用与应用模式,旨在为…

群控系统服务端开发模式-应用开发-短信工厂腾讯云短信开发

一、腾讯云短信工厂开发 1、添加框架对应的SDK composer require tencentcloud/tencentcloud-sdk-php 2、添加腾讯云工厂 在根目录下extend文件夹下Sms文件夹下channel文件夹下,创建腾讯云短信发送工厂并命名为TencentSmsSender。记住,一定要在腾讯云短…

【JavaEE】多线程(6)

一、用户态与内核态 【概念】 用户态是指用户程序运行时的状态,在这种状态下,CPU只能执行用户态下的指令,并且只能访问受限的内存空间 内核态是操作系统内核运行时的状态,内核是计算机系统的核心部分,CPU可以执行所有…