【论文阅读】CiteTracker: Correlating Image and Text for Visual Tracking

paper:NorahGreen/CiteTracker: [ICCV'23] CiteTracker: Correlating Image and Text for Visual Tracking (github.com)

code:NorahGreen/CiteTracker: [ICCV'23] CiteTracker: Correlating Image and Text for Visual Tracking (github.com)

简介

现有的视觉跟踪方法通常以图像块作为目标来跟踪。变化剧烈的目标跟踪困难。 CiteTracker 通过连接图像和文本来增强视觉跟踪中的目标建模和推理。文本生成模块将目标图像块转换为包含其类别和属性信息的描述性文本,为目标提供全面的参考点。动态描述模块来适应目标变化,以实现更有效的目标表示。使用基于注意力的关联模块将目标描述和搜索图像关联起来,以生成相关特征以供目标状态参考。

 

图 1. CiteTracker与现有跟踪方法在目标建模和关联方面的比较。左右部分分别描述了典型的视觉跟踪框架和CiteTracker:首先生成目标对象的文本描述,然后利用文本的特征来估计测试图像中的目标状态,从而实现更全面的目标建模和关联。

  • 特点:使用目标的自适应文本描述作为参考点,并将其与测试图像特征相关联进行跟踪。
  • 开发了一个文本生成模型,该模型具有预定义的开放词汇表,包括类和属性标签,能够基于目标图像块,生成目标的文本描述。以 CLIP 模型为基线构建,将文本与丰富的图像特征连接起来。
  • 为了适应目标随时间的变化,开发了一个动态文本特征模型,会随着目标的变化生成自适应文本特征。最后将目标文本描述的特征与测试图像特征相关联,以生成相关特征,以便进一步估计目标状态。
  • 实验数据集: GOT-10K、LaSOT、TrackingNet、OTB100 和 TNL2K。

方法

 

 

 

 

复现

处理数据

训练

准备数据

Set project paths

Run the following command to set paths for this project

python tracking/create_default_local_file.py --workspace_dir . --data_dir ./data --save_dir ./output

报错1:ModuleNotFoundError: No module named 'lib'

Traceback (most recent call last):File "tracking/create_default_local_file.py", line 9, in <module>from lib.train.admin import create_default_local_file_ITP_train
ModuleNotFoundError: No module named 'lib'

解决:

在终端输入:export PYTHONPATH=$PYTHONPATH:/data/CiteTracker-main/lib/train/admin

手动添加环境变量,解决。运行后得到如下两个文件:

报错2:ImportError: libGL.so.1: cannot open shared object file: No such file or directory

解决:pip install opencv-python-headless

下载lasot数据集:LaSOT Dataset | Papers With Code

共200多G 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/416721.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pr:媒体浏览器

Pr菜单&#xff1a;窗口/媒体浏览器 Window/Media Browser 快捷键&#xff1a;Shift 8 媒体浏览器 Media Browser是一个可以浏览、预览和导入不同类型媒体的面板。 在 Pr 中导入素材遇到问题时&#xff0c;可尝试使用媒体浏览器。 媒体浏览器是导入各类媒体的最佳选择&#xf…

C8T6超绝模块--LED

C8T6超绝模块–LED 大纲 怎样点亮LED结构体分析代码流程 具体案例 怎样点亮LED 首先不同的芯片的接法不一样&#xff0c;需要自己查看自己的芯片的原理图&#xff0c;我使用的是C8T6&#xff0c;使用的PC13接入的LED 注意看&#xff1a;怎么才能使LED灯亮呢&#xff1f; …

硬件工程师笔试面试——上拉电阻、下拉电阻

目录 1.3、上拉电阻 原理图 1.3.1、定义 1.3.2、作用 1.3.3、工作原理 1.3.4、选择上拉电阻的值 1.3.5、应用场景 1.3.6、与下拉电阻的区别 1.3.7、设计考虑 1.3.8电路设计中的注意事项 1.3.9、与ESD保护的结合 1.3.10、实际应用 1.3.11、上拉电阻在不同电压等级的…

【前端学习】AntV G6-07 深入图形与图形分组、自定义节点、节点动画(上、中)

课程链接 AntV G6&#xff1a;深入图形与图形分组、自定义节点、节点动画&#xff08;上&#xff09;_哔哩哔哩_bilibili AntV G6&#xff1a;深入图形与图形分组、自定义节点、节点动画&#xff08;中&#xff09;_哔哩哔哩_bilibili 图形分组 Group | G6 (antgroup.com) 自…

K8S 发布应用

前言 昨儿个用 unbuntu20.04 又装了一次K8S 用的 kubeadm containerd Cilium (CNI) 又重新撸了一遍 这里只记录 应用发布的笔记 正文 #创建deployment kubectl create deployment nginx --imagenginx #我这边大约30秒后显示为 ready kubectl get deployments kubectl desc…

MySQL - 基础 - 概述

基础 - 概述 一、相关概念 1、数据库&#xff08;DB&#xff09; 存储数据的仓库&#xff0c;数据是有组织的进行存储 2、数据库管理系统&#xff08;DBMS&#xff09; 操纵和管理数据库的大型软件 3、SQL 操作关系型数据库的编程语言&#xff0c;定义了一套操作关系型数据库…

【设计模式】工厂模式与策略模式的区别

目录 1、工厂模式 2、策略模式 3、区别 3.1、工厂模式 1. 目的&#xff1a; 2. 使用场景&#xff1a; 3. 实现方式&#xff1a; 4. 示例&#xff1a; 3.2、策略模式 1. 目的&#xff1a; 2. 使用场景&#xff1a; 3. 实现方式&#xff1a; 4. 示例&#xff1a; 工…

权威解读|2024固定网国内数据传送业务办理指南

一、固定网国内数据传送业务是什么&#xff1f; 固定网国内数据传送业务&#xff0c;是指互联网数据传送业务以外的&#xff0c;在固定网中以有线方式提供的国内端到端数据传送业务。主要包括基于IP承载网、ATM网、X.25分组交换网、DDN网、帧中继网络的数据传送业务等。 根据…

数据库管理-第238期 23ai:全球分布式数据库-架构与组件(20240904)

数据库管理238期 2024-09-04 数据库管理-第238期 23ai&#xff1a;全球分布式数据库-架构与组件&#xff08;20240904&#xff09;1 架构图2 分片数据库与分片3 Shard Catalog4 Shard Director5 Global Service6 管理界面总结 数据库管理-第238期 23ai&#xff1a;全球分布式数…

地理围栏,打造智能生活新边界

随着智能手机和其他移动设备的普及&#xff0c;用户对基于位置获取个性化服务的需求大幅增加&#xff0c;例如用户进入商圈范围并停留操作一段时间后&#xff0c;智能触发向用户推送该商圈吃、喝、玩、乐的优惠活动消息&#xff1b;又如当用户到达非常驻地的机场时触发围栏&…

工业网关在汽车智能工厂中的应用-天拓四方

工业网关是工业物联网&#xff08;IIoT&#xff09;的关键组成部分&#xff0c;它充当了工业现场设备与云端或企业级系统之间的桥梁。在智能工厂中&#xff0c;工业网关的应用至关重要&#xff0c;它确保了生产线的顺畅运行&#xff0c;并通过数据的透明化&#xff0c;提升了生…

《高等代数》范德蒙德行列式的应用

说明&#xff1a;此文章用于本人复习巩固&#xff0c;如果也能帮助到大家那就更加有意义了。 注&#xff1a;范德蒙德行列式的简单应用及其变形。 范德蒙德行列式的计算公式&#xff1a; 注&#xff1a;&#xff08;1&#xff09;用大下标减去小下标。 &#xff08;2&#xf…

QFile打开文件的两种方式

一、UI界面设置两个按键&#xff0c;并直接转到槽函数 二、两种代码展示 #include <QFile> #include <QDebug>//此两种方式中调用函数&#xff0c;应包含的头文件void Widget::on_btnReadFile01_clicked()//第一种打开方式 {//1. 打开文件QFile file;file.setFile…

密钥加密机的定义与功能

密钥加密机是信息安全领域中的核心设备&#xff0c;通过密码学原理&#xff0c;利用加密算法和密钥管理技术&#xff0c;对通信内容进行加密保护&#xff0c;确保数据在传输过程中的机密性、完整性和真实性。以下是对密钥加密机的详细阐述&#xff1a; 一、定义与功能 定义&…

集成电路学习:什么是OLED有机发光二极管

一、OLED&#xff1a;有机发光二极管 OLED&#xff0c;全称有机发光二极管&#xff08;Organic Light-Emitting Diode&#xff09;&#xff0c;是一种电流型的有机发光器件。以下是关于OLED的详细介绍&#xff1a; 二、OLED的定义与原理 OLED是基于有机半导体材料和发光材料在…

【游戏安全】CheatEngine基础使用——如何对不同类型的数值进行搜索?如何破解数值加密找到想修改的数值?

游戏安全 不同数值类型的搜索破解简单数值加密 不同数值类型的搜索 可以在游戏中看到很精确的物品数量&#xff0c;但是在CE中却什么都扫不到。 这是因为他的数值类型可能并不是四字节的&#xff0c;在游戏中这个数值的机制是一个慢慢增长的数值&#xff0c;所以他很有可能是…

信息安全威胁

关注这个证书的其他相关笔记&#xff1a;NISP 一级 —— 考证笔记合集-CSDN博客 0x01&#xff1a;我国面临的信息安全威胁 从受威胁的对象来看&#xff0c;可以将我国面临的信息安全威胁分为三类&#xff1a;国家威胁、组织威胁和个人威胁。 来自国家的威胁&#xff1a; 恐怖组…

Hive服务部署及Datagrip工具使用

目录 Hive服务部署 Hiveserver2服务 1&#xff09;用户说明 2&#xff09;Hiveserver2部署 &#xff08;1&#xff09;Hadoop端配置 &#xff08;2&#xff09;Hive端配置 3&#xff09;测试 &#xff08;1&#xff09;启动Hiveserver2 &#xff08;2&#xff09;使用命…

计算机工具软件安装攻略:Visual Studio Code下载、安装和使用

Visual Studio Code下载、安装和使用 1 Visual Studio Code简介 Visual Studio Code通常简称为VS Code&#xff0c;是一款由微软开发的免费、开源的轻量级代码编辑器。它在开发者社区中非常受欢迎&#xff0c;具有强大的功能和扩展性&#xff0c;适用于多种编程语言和开发场景…

激光器原理--材料篇

半导体材参杂 https://zhuanlan.zhihu.com/p/24683205 能带跃迁&#xff0c;能量变化&#xff0c;从电变为光。 Si半导体是间隙带隙&#xff0c; 三五族是直接带隙。直接带隙方便跃迁&#xff0c;容易出光