[项目]深度估计增强的多目标跟踪

[项目]深度估计增强的多目标跟踪

news/2024/12/23 23:45:05/文章来源:https://blog.csdn.net/wjpwjpwjp0831/article/details/136358464

去年10月开始到年底，做了一个小工作，就是将自监督单目深度估计与MOT结合，目的是充分利用深度信息解决遮挡问题，并且在估计深度的同时可以估计相机位姿，这是可以计算出相邻两帧像素的映射。这在视角较大变化下比较有用。
在无人机数据集上（VisDrone和UAVDT）表明，方法是比较有效的。

希望这个工作能给大家一些参考和启发吧！如果有改进的建议，非常欢迎大家提出。

项目地址：https://github.com/JackWoo0831/DepthMOT，欢迎大家star！

研究动机与方法

在这里插入图片描述

在这里插入图片描述

以下是项目的README

DepthMOT

Abstract:

Accurately distinguishing each object is a fundamental goal of Multi-object tracking (MOT) algorithms. However, achieving this goal
still remains challenging, primarily due to: (i) For crowded scenes with occluded objects, the high overlap of object bounding boxes leads to
confusion among closely located objects. Nevertheless, humans naturally perceive the depth of elements in a scene when observing 2D videos. Inspired
by this, even though the bounding boxes of objects are close on the camera plane, we can differentiate them in the depth dimension, thereby
establishing a 3D perception of the objects. (ii) For videos with rapidly irregular camera motion, abrupt changes in object positions can result in
ID switches. However, if the camera pose are known, we can compensate for the errors in linear motion models. In this paper, we propose DepthMOT, which achieves: (i) detecting and estimating scene depth map end-to-end, (ii) compensating the irregular camera motion by camera pose estimation. Extensive experiments demonstrate the superior performance of DepthMOT in VisDrone-MOT and UAVDT datasets.

Model Introduction

We intergrate part of monodepth2 and FairMOT to estimate the depth of objects and compensate irregular camera motions. Many thanks to their outstanding works! Below are the motivation and paradigm of DepthMOT.

Installation

Please refer to FairMOT to config virtual environment and prepare data.

For VisDrone, UAVDT, KITTI datasets, the data conversion code are available at src/dataset_tools

Model Zoo

Pretrained model

FairMOT pretrain (COCO) + monodepth2 pretrain (KITTI):
BaiduYun, code: us93

VisDrone:
BaiduYun, code: alse

Training

All traning scripts are in ./experiments

Training visdrone:

sh experiments/train_visdrone.sh

Training uavdt:

sh experiments/train_uavdt.sh

Training kitti:

sh experiments/train_kitti.sh

Note that if training kitti, it’s recommended to modify the input resolution to (1280, 384) in line 32, src/train.py:

dataset = Dataset(opt, dataset_root, trainset_paths, (1280, 384), augment=False, transforms=transforms)

Testing

Similarly to training, for testing, you need to run:

sh experiments/test_{dataset_name}.sh

Performance

Dataset	HOTA	MOTA	IDF1
VisDrone	42.44	37.04	54.02
UAVDT	66.44	62.28	78.13

Results on KITTI is somehow inferior. Better results are obtaining.

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/265736.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

OpenCV实现目标追踪

OpenCV实现目标追踪

目录准备工作语言： 软件包： 效果演示代码解读 （1）导入OpenCV库 （2）使用 cv2.VideoCapture 打开指定路径的视频文件 （3）使用 vid.read() 读取视频的第一帧，ret…

阅读更多...

MyBatis 学习（一）之 MyBatis 概述

MyBatis 学习（一）之 MyBatis 概述

目录 1 MyBatis 介绍 2 MyBatis 的重要组件 3 MyBatis 执行流程 4 参考文档 1 MyBatis 介绍 MyBatis 是一个半自动化的 ORM （Object-Relational Mapping，对象关系映射）持久层框架，它允许开发者通过 XML 或注解将对象与数据库中…

阅读更多...

proteus8.15图文安装教程

proteus8.15图文安装教程

proteus8.15版本可以用STM32系列单片机来进行仿真设计，比7.8版本方便多了，有需要的朋友们可以在公众号后台回复 proteus8.15 获取软件包。 1、下载好软件包，解压如下，右键proteus8.15.sp1以管理员身份运行。 2、第一次安装&#x…

阅读更多...

获取tensorflow lite模型指定中间层的输出

获取tensorflow lite模型指定中间层的输出

以mobilenet v2为例子，我已经训练好了模型，有tflite格式和onnx格式两种模型的权重文件，我想获取tflite模型在推理阶段neck部分的输出。查看onnx模型得到neck最后一层位置使用netron查看onnx模型结构从name中能知道Reshape是neck的最后一…

阅读更多...

clickhouse 随心所欲的聚合模型-AggregatingMergeTree

clickhouse 随心所欲的聚合模型-AggregatingMergeTree

clickhouse 强大的 MergeTree 系列引擎令人信服，其 ReplacingMergeTree、SummingMergeTree 在数据唯一性和汇总场景中表现非凡。但你是否还有保留最小(大)、平均等预聚合需求，甚至在一个模型中既有唯一性语意也有汇总、最小、最大、平均值语意该如何处理…

阅读更多...

DBAPI如何使用数组类型参数

DBAPI如何使用数组类型参数

DBAPI如何使用数组类型参数需求根据多个id去查询学生信息 API创建在基本信息标签，创建参数ids ，参数类型选择 Array<bigint> 在执行器标签，填写sql，使用in查询 select * from student where id in <foreach ope…

阅读更多...

Unity（第十一部）场景

Unity（第十一部）场景

游戏有多个场景组成（新手村，某某副本，主城） 场景是有多个物体组成（怪物，地形，玩家等） 物体是有多个组件组成（刚体组件，自定义脚本） 创建场景编辑…

阅读更多...

Folx Pro Mac中文p破解版如何使用？为您带来Folx Pro 详细使用教程！

Folx Pro Mac中文p破解版如何使用？为您带来Folx Pro 详细使用教程！

Folx pro 5 中文版是mac上一款功能强大的老牌加速下载软件，新版本的Folx pro整体界面非常的简洁和漂亮，具有非常好用的分类管理功能，支持高速下载、定时下载、速度控制、iTunes集成等功能。Folx pro兼容主流的浏览器，不但可以下…

阅读更多...

【卷积神经网络中用1*1 卷积有什么作用或者好处呢？】

【卷积神经网络中用1*1 卷积有什么作用或者好处呢？】

🚀 作者 ：“码上有前” 🚀 文章简介 ：深度学习 🚀 欢迎小伙伴们点赞👍、收藏⭐、留言💬 1*1 卷积有什么作用或者好处呢作用降维和增加非线性特征组合和交互网络的宽度和深度调整全连接替代增强…

阅读更多...

09-认证-自研微服务框架

09-认证-自研微服务框架

认证 1. 开启https支持 func (e *Engine) RunTLS(addr, certFile, keyFile string) {err : http.ListenAndServeTLS(addr, certFile, keyFile, e.Handler())if err ! nil {log.Fatal(err)} }1.1 测试证书生成： 安装openssl 网站下载：http://slproweb…

阅读更多...

华为HCIP Datacom H12-831 卷24

华为HCIP Datacom H12-831 卷24

多选题 1、如图所示，某园区部署OSPF实现网络互通，其中Area1部署为NSSA区域。某工程师为了实现R1访问R4的环回口地址，在R4的OSPF进程中引入直连路由。以下关于该场景的描述,错误的有哪些项? A、在R4引入直连路由后，R1通过转换后的…

阅读更多...

Socket网络编程(三)——TCP快速入门

Socket网络编程(三)——TCP快速入门

目录概述TCP连接可靠性1. 三次握手过程2. 四次挥手过程3. 为什么挥手需要四次？ 传输可靠性TCP核心APITCP传输初始化配置&建立连接客户端创建Socket建立连接服务端创建ServerSocket监听连接ServerSocket 和 Socket的关系 Socket基本数据类型传输客户端数据传输服…

阅读更多...

postman测试接口

postman测试接口

1、postman测试接口 （1）首先安装postman 下载地址：Download Postman | Get Started for Free 选择对应版本下载，然后安装即可 （2）使用postman发送请求比如以下这个请求例子： 使用postman发…

阅读更多...

UE4 材质多张图片拼接成一张图片（此处用2×2拼接）

UE4 材质多张图片拼接成一张图片（此处用2×2拼接）

UE4 材质多张图片拼接成一张图片（此处用22拼接） //TexCoord,TextureA,TextureB,TextureC,TextureDfloat3 ReturnTexture TextureA; if(TexCoord.x < 0.5 && TexCoord.y < 0.5) {ReturnTexture TextureA; } else if(TexCoord.x > 0.5…

阅读更多...

php docx,pptx,excel表格上传阿里云,腾讯云存储后截取第一页生成缩略图

php docx,pptx,excel表格上传阿里云,腾讯云存储后截取第一页生成缩略图

php把word转图片的方法：首先给服务器安装libreoffice；然后使用exec函数来调用命令行操作；最后通过“exec(“soffice --headless --invisible…””方法把word转图片即可。服务器环境：centos7 *集成环境：宝塔我们开始给服务器安装libreoffice 直接执行下面的代码就可以…

阅读更多...

代码随想录Leetcode213. 打家劫舍 II

代码随想录Leetcode213. 打家劫舍 II

题目： 代码(首刷看解析 2024年2月29日）： class Solution { public:int robRange(vector<int>& nums, int start, int end) {if (start end) return nums[start];vector<int> dp(nums.size(), 0); // 遍历dp[start] nums[s…

阅读更多...

【Oracle】玩转Oracle数据库（七）：RMAN恢复管理器

【Oracle】玩转Oracle数据库（七）：RMAN恢复管理器

前言嘿，数据库大魔法师们！准备好迎接新的技术大招了吗？今天我们要探索的是Oracle数据库中的神奇利器——RMAN恢复管理器！🛡️💾 在这篇博文【Oracle】玩转Oracle数据库（七）&#xf…

阅读更多...

mov和mp4格式哪个好？专业讲师告诉你答案【详】

在数字化时代，我们经常面临着选择视频格式的困境，尤其是需要在不同设备和平台上播放或分享视频时。在这些选择中，MOV和MP4格式是两种最常见的选项之一。然而，mov和mp4格式哪个好呢？这个问题并不容易回答，…

阅读更多...

C++重点---STL简介

C++重点---STL简介

顾得泉：个人主页个人专栏：《Linux操作系统》《C从入门到精通》《LeedCode刷题》键盘敲烂，年薪百万！ 一、STL简介 STL（Standard Template Library）是C标准库中的一个重要组成部分，它提供了…

阅读更多...

LabVIEW水下温盐深数据一体化采集与分析

LabVIEW水下温盐深数据一体化采集与分析

LabVIEW水下温盐深数据一体化采集与分析开发一个基于LabVIEW的水下温盐深数据一体化采集与分析系统，实现海洋环境监测的自动化和精确化。通过集成温度、盐度和深度传感器，结合USB数据采集卡，利用LabVIEW软件开发的图形化界面，实…

阅读更多...

最新文章

推荐文章