无人机下的目标检测研究(附论文下载)

关注并星标

从此不迷路

计算机视觉研究院

45046c778ca03872578fa616f0c60259.gif

31f72db9c31796ab061eb3eb508e54ae.gif

7558d68c9b189592335be91b5f99249e.png

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

567f5d58218fea4061a437681667d6de.jpeg

论文信息:冷佳旭,莫梦竟成,周应华,叶永明,高陈强,高新波*. 无人机视角下的目标检测研究进展. 中国图象图形学报,2023.

作者单位:重庆邮电大学计算机科学与技术学院,重庆邮电大学通信与信息工程学院

论文连接:http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=202208160000003&journal_id=jig

计算机视觉研究院专栏

作者:Edison_G

本文综合考察了无人机视角下的目标检测研究进展近年的发展和进步,总结并分析了无人机视角下目标检测所面临的不均衡挑战问题,然后对已有算法进行了归类、分析和比较,评述代表性方法的技术特点和区别,并系统对比分析现有对比学习方法在不同基准数据集上的性能表现。此外,本文展示了无人机目标检测算法在交通监控、电力巡检、作物分析以及灾害救援等多个领域的实际应用。

摘要

在人工智能技术的支持下,无人机初步获得智能感知能力,在实际应用中展现出高效灵活的数据收集能力。其中,无人机视角下的目标检测作为关键核心技术,在诸多领域中发挥着不可替代的作用,具有重要的研究意义。为了进一步展现无人机视角下的目标检测研究进展,本文对无人机视角下的目标检测算法进行了全面的总结,并对已有算法进行了归类、分析和比较。首先,介绍无人机视角下的目标检测概念,并总结了无人机视角下目标检测所面临的目标尺度、空间分布、样本数量、类别语义以及优化目标等五大不均衡挑战。在介绍现有研究方法的基础上,本文特别整理并介绍了无人机视角下目标检测算法在交通监控、电力巡检、作物分析和灾害救援等实际场景中的应用。然后,重点阐述从数据增强策略、多尺度特征融合、区域聚焦策略、多任务学习、以及模型轻量化等方面来提升无人机视角下目标检测性能的方法,总结这些方法的优缺点并分析了其与现存挑战之间的关联性。之后,全面介绍基于无人机视角的目标检测数据集,并呈现已有算法在两个较为常用的公共数据集上的性能评估。最后本文对无人机视角下目标检测技术的未来发展方向进行了展望。

45a522303144de988ff7b93adc28a03e.png

引言

以目标检测为代表的计算机视觉等先进技术为无人机赋予了自主感知、分析和决策能力,使其在现实生活中发挥着愈发重要的作用。无人机结合智能目标检测技术可自主定位感兴趣目标,可充分发挥其独特空中视角及高机动性的优势,从而实现灵活高效的数据收集能力。随着目标检测技术的发展,无人机在交通监控(Byun 等,2021)、电力巡检(Abdelfattah 等,2020)、作物分析(Osco 等,2021a)和灾害救援(Božić-Štulić 等,2019)等多个领域中展现出广阔的应用前景。例如在交通监控领域,无人机可以空中飞行进行侦测,不受道路限制,具有速度快、自由度高、视野宽广等优点。当交通事故等突发事件发生时,无人机可以第一时间进行响应,到达现场进行图像采集与分析,为应急救援与管理提供及时有效的数据支撑。在深度学习的驱动下,目标检测技术获得了长足的发展,取得了诸多令人瞩目的成就。然而,大多数研究聚焦于地面视频监控图像的分析,面向无人机视角图像的目标检测还未得到充分的研究。目前,即使是最好的目标检测算法,在无人机图像上的平均精确率也难以达到40%(Cao 等,2021)。

无人机视角下的目标检测之所以难,其主要原因在于无人机图像存在尺度变化、疏密分布、目标数量较多且小目标占比较高等问题,特别是无人机高分辨率图像高计算需求与现阶段低功耗芯片有限算力之间的矛盾难以平衡。相对于地面视角拍摄的自然图像,无人机视角下的广阔视场在提供更为丰富的可视化信息的同时,也意味着更为复杂的场景和更加多样的目标,给目标检测任务带来了更多无用噪声的干扰。而且在无人机视角下,图像中的目标往往因远端拍摄、背景遮挡或光照影响等因素检测难度较大,需要使用高分辨率图像提供更多的信息以达到较好的检测效果。这极大地增加了目标检测算法的计算开销与内存需求,直接使用未经过特殊设计的通用目标检测算法将带来难以承受的计算开销与内存需求,进一步加剧了目标检测的难度。在实际应用场景中,往往面临着类似于识别车辆种类这种细粒度分类的问题,这些相似目标给模型正确识别目标带来了巨大的挑战。此外,受限于现实世界中的目标数量,无人机视角下某些类别的样本数量往往极为有限,这种数据不均衡也对模型的学习能力提出了更高的要求。

因此,紧密结合智能目标检测技术,针对无人机视角下图像的特性设计行之有效的方法,促使模型更好地学习理解无人机视角下的视觉数据,对于无人机在实际场景中充分发挥其效用是至关重要的。无人机视角下的目标检测在应用广泛的同时面临着诸多挑战,具有深刻的现实意义与重要的研究意义。对无人机视角下的目标检测展开研究将有助于推动目标检测领域的进一步发展,增强目标检测在面对真实场景时的应用能力。

08d2cc7ddead8be1d1324e0cd1a81a09.png

目标检测作为计算机视觉领域的基础研究,已有学者对此进行研究与总结,并发表许多优秀的综述。Zou等人(2019)梳理了400多篇关于目标检测技术发展的论文,系统而全面地展现了目标检测领域。Oksuz等人(2020)则从目标检测中存在的类别不平衡、尺度不平衡、空间不平衡以及优化目标不平衡等四大不平衡问题出发,对现有的目标检测算法进行了深入的总结。Chen等人(2020)则从小目标四大基础方法的角度出发,总结并分析了小目标检测的相关优化思路。曹家乐等人(2022)回顾并总结了基于单目相机的视觉目标检测方法,并对比介绍了单目目标检测和双目目标检测的国内外研究进展情况。然而,以上综述对于无人机视角下目标检测的关注不够,未能系统地梳理无人机视角下的目标检测方法和面临的挑战。

聚焦到无人机视角下的目标检测,Mittal等人(2020)关注低空无人机数据集,评估并总结了当前流行的目标检测算法,但是局限于简单的性能对比,没有深入的总结分析。Sambolek等人(2020)介绍了在搜索和救援行动中使用无人机的可能性,并提供了在无人机图像中检测相关人员的方法概述。Srivastava等人(2021)则关注无人机图像的车辆检测,从提高精度和减少计算开销两个方面回顾了这些工作。Bouguettaya等人(2021)则关注于无人机视角下的车辆检测应用,总结并介绍了多种网络结构对于改善车辆检测的贡献。江波等人(2021)对常见的航空影像数据集进行了梳理,并对近期的无人机目标检测研究进行了归纳和分析。杨浩然等人(2022a)则对目标检测相关算法进行了简单的优缺点分析。然而,这些综述对于无人机视角下面临的挑战总结不够系统,在算法方面的趋势总结较为薄弱,而且对于目标检测算法的实际应用阐述也较为简略。

36c4535bf343b67ef25485ce03904bc6.png

与以往关注于通用领域目标检测的综述或仅关注于无人机在特定应用场景下应用的综述不同,本文着重于对无人机视角下的目标检测这一意义重大且极具挑战性的研究领域进行系统且深入的分析与总结。本文首先简要阐述无人机视角下目标检测的重要研究意义,然后将对无人机视角下目标检测领域中存在的挑战进行系统的归纳和总结,随之将介绍并分析无人机视角下的目标检测优化思路,包括数据增强、多尺度特征融合、区域聚焦策略、多任务学习、模型轻量化以及其他优化策略等。本文将特别展示无人机视角下目标检测算法的应用,阐明该研究的实际意义。此外,本文将介绍无人机视角下适用于检测任务的相关数据集,并在常用的数据集上分析对比现有算法的检测性能。最后,对本文内容进行简要的总结,并讨论无人机视角下的目标检测未来可能的研究方向和发展趋势。

© The Ending

转载请联系本公众号获得授权

6512a221a8dcc0272f865e85d276d072.gif

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

084cbd2ec395f03f2502f2c45df61a81.jpeg

扫码关注

计算机视觉研究院

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

 往期推荐 

🔗

  • 计算机视觉研究院亲自体验ChatGPT的感受,太疯狂了!

  • 用于吸烟行为检测的可解释特征学习框架(附论文下载)

  • 图像自适应YOLO:恶劣天气下的目标检测(附源代码)

  • 新冠状病毒自动口罩检测:方法的比较分析(附源代码)

  • NÜWA:女娲算法,多模态预训练模型,大杀四方!(附源代码下载)

  • 实用教程详解:模型部署,用DNN模块部署YOLOv5目标检测(附源代码)

  • LCCL网络:相互指导博弈来提升目标检测精度(附源代码)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/28327.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【论文阅读】Segment Anything(SAM)——可分割一切的CV大模型

【前言】随着ChatGPT席卷自然语言处理,Facebook凭借着Segment Anything在CV圈也算扳回一城。迄今为止,github的star已经超过3万,火的可谓一塌糊涂。作为AI菜鸟,可不得自己爬到巨人肩膀上瞅一瞅~ 论文地址:https://arxi…

文心一言App在苹果AppStore上架;首款搭载ChatGPT的自行车问世;QQ Windows全新上架|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

马斯克每周“硬核”工作 120 小时,网友:“只要醒着都在工作?”

整理 | 朱珂欣 出品 | CSDN(ID:CSDNnews) 众所周知,自从埃隆马斯克(Elon Musk)去年收购 Twitter 起,可谓是坐拥“热搜体质”:接管 Twitter 一周后的“灭霸式”裁员、与工程师在 T…

华为盘古3.0大模型的访问入口在哪里?

体验入口:盘古NLP大模型_LLM_大语言模型_华为云 (huaweicloud.com) 网盘链接:https://pan.baidu.com/s/1TsZ78aMcbYXEY9IMXW7QDQ?pwdpn1t 提取码:pn1t 终于,华为的大模型动向来了! 盘古大模型3.0,今…

ChatGPT实战:如何规划自己的职业生涯?

ChatGPT的出现,不仅改变了人们对人工智能技术的认识,也对经济社会发展产生了深远的影响。那么,在ChatGPT时代,人们应该如何规划自己的职业呢? 职业规划是一个有意义且重要的过程,它可以帮助你在职业生涯中…

基于ChatGPT和私有知识库搭建Quivr项目

准备工作 安装docker和docker-compose申请supabase账号 拉取Quivr代码 git clone https://github.com/StanGirard/Quivr.git 复制.XXXXX_env文件 cp .backend_env.example backend/.env cp .frontend_env.example frontend/.env 更新backend/.env和frontend/.env文件 ba…

图像标注工具CVAT

图像标注工具CVAT 简介创建账户教程 简介 CVAT支持多用户在线协同。 OpenCV团队正在使用该工具来标注不同属性的数百万个对象,特有的功能: (1)关键帧之间的边界框插值 (2)自动标注(使用TensorFlow OD API 和 Intel OpenVINO IR格式的深度学习模型&#…

无需人工标注,自生成指令框架打破ChatGPT等LLM的成本瓶颈

来源:机器之心 当前,大型语言模型的性能已经达到了很高的水平,除了进一步挖掘其潜力,我们还应该关注到模型背后的人工标注成本。 ChatGPT 是今年年底 AI 圈的新晋顶流,人们惊叹于它强大的问答语言能力和掌握的编程知识…

NLP之情感分析:基于python实现中文文本情感分析

NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分) 输出结果 1、测试对象 data1 今天上海的天气真好!我的心情非常高兴!如果去旅游的话我会非常兴奋!和你一起去旅游我会更加幸福! data2 …

详细介绍NLP对话系统

任务型对话系统 任务型对话系统主要应用于固定领域。任务型对话的广泛应用的方法有两种,一种是模块法,另一种是端到端的方法。 模块法是将对话响应视为模块,每个模块负责特定的任务,并将处理结果传送给下一个模块。 端到端的任务…

python实现中文情感分析与可视化

目录 一、导入原始数据 二、结巴分词/绘制词云图 三、计算情感值,情感分析 # 方法一、SnowNLP计算情感得分 # 方法二、使用字典计算情感得分 四、# 数据可视化展示 五、绘制相关系数热力图 一、导入原始数据 #导入模块 import pandas as pd import numpy as np …

《PlumGPT:让你的聊天更智能,更有趣》

《PlumGPT:让你的聊天更智能,更有趣!》 文章目录 《PlumGPT:让你的聊天更智能,更有趣!》前言一、入口地址二、开始注册三、开始验证四、进入首页五、功能点介绍1.Light mode2.Help3.My account4.Log out 六…

【句子互动转载】1. 对话系统趋势分析

作者:李佳芮_chatbot 链接:https://www.jianshu.com/p/89d621c9cffe 来源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 本章我会带领大家了解对话系统的趋势,以及为什么我们要搭建一个…

【四】情感对话 Improving Multi-turn Emotional Support Dialogue Generation with Lookahead Strategy Planning

【四】情感支撑对话论文最近进展 Emotion Support Conversation 今天给大家分享一篇在EMNLP 2022的关于情感对话的论文。主要思想是从策略安排的角度来有效地提供情感支撑,并且通过理解用户的状态达到更好的生成效果。 相关情感支撑论文综述整理指路 -> 点这里…

【一】情感对话 Towards Emotional Support Dialog Systems 论文阅读

【一】情感支撑对话论文最近进展 Emotion Support Conversation 今天给大家介绍一下Towards Emotional Support Dialog Systems这篇由黄老师团队发表在2021 ACL的数据集。 相关论文综述整理指路 -> 点这里 主要分成以下几个部分进行介绍: 研究背景实例介绍ES…

ChatGPT接口返回代码高亮显示的实现逻辑

官方API:POST https://api.openai.com/v1/chat/completions 我们在使用openai提供的接口时,返回的数据如果包含代码,会发现代码是没有样式的,它们一般是用包含的一段文本。 如图: 怎么样才能做到和官方一样的美观呢&…

还在crud?快来学习架构设计啦---微服务下的依赖管理(maven篇)

文章目录 一、前言二、实战2.1 创建父工程统一依赖的版本管理2.2 创建公共使用的 common工程2.3 创建子工程并引入父工程的依赖以及公共工程2.4 搭建启动环境2.5 启动程序开始验证 三、总结 一、前言 2023年口罩放开的第一年,大多数人都是想着重新开始,…

ChatGPT 4.0 —— Code Interpreter

📎产品销售数据集.csv 选取以上的数据集作为输入,对Code Interpreter 进行测试 1.输入指定数据集,要求给出该数据集的概貌 2.请分析销售的总金额和其他变量的关系 Python Script: # Import required libraries import matplotlib.pyplot a…

500行JavaScript代码在前端根据数据生成CAD工程剖面图

前言 ​ 用数据生成CAD图,一般采用的ObjectArx对CAD二次开发完成。ObjectARX是AutoDesk公司针对AutoCAD平台上的二次开发而推出的一个开发软件包,它提供了以C为基础的面向对象的开发环境及应用程序接口,能访问和创建AutoCAD图形数据库。而由…

SolidWorks+thonny esp32 电磁控制,程序算法搞起来了,我的结构-仿真-电磁-控制-算法的学习之路

来个自我介绍,本科是微电子制造专业,隶属于机电工程学院,所以机械,电子,控制,流体,材料,结构这些基础都有,而且水平不低。工作了13年,主要干机械,…