[RIS]GRES: Generalized Referring Expression Segmentation

[RIS]GRES: Generalized Referring Expression Segmentation

news/2024/12/24 1:57:44/文章来源:https://blog.csdn.net/weixin_45863274/article/details/141686376

1. BaseInfo


Title	GRES: Generalized Referring Expression Segmentation
Adress	https://arxiv.org/pdf/2306.00968
Journal/Time	CVPR2023
Author	南洋理工
Code	https://github.com/henghuiding/ReLA
Read	20240829
Table	VisonLanguage

2. Creative Q&A

考虑结果多目标和无目标，基于 Mask2Former，能够指向任意数量的目标类别
数据集 gRefCOCO 构建，包含单目标、多目标和无目标。
ReLA

3. Concrete

在这里插入图片描述
主要是多目标和无目标的改进。
prediction ：图像、文本、GT Mask、预测结果、有无目标。

        out = {'pred_logits': predictions_class[-1], # [B, Q, num_classes + 1]'pred_masks': tgt_mask, # [ B, num_classes + 1, H/4, W/4]'all_masks': outputs_mask,'nt_label': nt_label # [B, 2]}

3.1. Model

arch
将视觉和语言特征输入 ReLA 模块。
在这里插入图片描述

3.1.1. Input

图片+文本

3.1.2. Backbone

Swin-Transformer + BERT

3.1.3. Neck

3.1.4. Decoder

在 RelA 后就是很简单的 MLP

3.1.5. Loss

交叉熵损失

3.2. Training

3.2.1 Dataset

RefCOCO
RefCOCO+
G-Ref
gRefCOCO

3.3. Eval

cumulative IoU (cIoU) and Precision@X (Pr@X), we further introduce No-target accuracy (N-acc.), Target accuracy (T-acc.), and generalized IoU (gIoU) for GRES.

在 gRefCOCO 上的

3.4. Ablation

数据集的必要性
RIA 和 RLA 的必要性
P 的数量 10 最佳

4. Reference

RES 系列 GRES: Generalized Referring Expression Segmentation 论文阅读笔记

5. Additional

有点吃显存。
简单读一下，后面 ReLA 还是没怎么看懂。后面再结合代码读的时候再详细写吧…

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/411835.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

2024软考：一场与“难”共舞的奇妙冒险，你值得拥有！

2024软考：一场与“难”共舞的奇妙冒险，你值得拥有！

在这个时代，如果说有什么考试能让IT界的勇士们闻风丧胆，又爱又恨，那软考绝对能C位出道，成为众多技术大佬心中的“白月光”与“朱砂痣”。随着岁月悠悠，2024年的软考似乎又悄悄地在难度上动了点小心思，让人不…

阅读更多...

【C++ Primer Plus习题】6.5

【C++ Primer Plus习题】6.5

问题: 解答: #include <iostream> using namespace std;int main() {float salary 0;float tax 0;while (salary>0){cout << "请输入您的工资:";cin >> salary;if (cin.fail())break;if (salary < 5000){tax 0;}else if (salary < 15…

阅读更多...

风控领域特征工程

风控领域特征工程

在金融行业，风险控制（风控）是核心环节，它关乎资产安全、合规性以及机构的长期稳健发展。随着大数据时代的到来，金融机构面临着前所未有的数据量和复杂性。在这样的背景下，风控领域特征工程应运而生&#xf…

阅读更多...

20240829版图的层次

20240829版图的层次

1 最常用 Esc：取消操作 i：插入元件版图 c：复制 m：移动 u：撤销上一步操作 q：查看属性 f：全局视图 e：显示设置（图层、栅格、走线模式等） r：矩形填充…

阅读更多...

＜Rust＞egui学习之小部件（六）：如何在窗口中添加菜单栏部件？

＜Rust＞egui学习之小部件（六）：如何在窗口中添加菜单栏部件？

前言本专栏是关于Rust的GUI库egui的部件讲解及应用实例分析，主要讲解egui的源代码、部件属性、如何应用。环境配置系统：windows 平台：visual studio code 语言：rust 库：egui、eframe 概述本文是本专栏的第六篇博…

阅读更多...

【爬虫软件】采集抖音博主的主页发布作品

【爬虫软件】采集抖音博主的主页发布作品

这是我用python开发的抖音爬虫采集软件，可自动按博主抓取已发布视频。软件界面截图： 爬取结果截图： 几点重要说明： 软件使用演示视频： https://www.bilibili.com/video/BV1Kb42187qf 完整讲解文章： ht…

阅读更多...

释放金融交易的未来：掌握量化机器人技术

释放金融交易的未来：掌握量化机器人技术

在金融交易的竞技场上，量化机器人技术正成为投资者手中的一张王牌，引领着交易策略的未来。本文将向您展示量化机器人如何成为金融交易的变革者，并向您展示如何利用这一技术来优化您的投资策略。量化机器人的力量量化机器人技术是金融交易领…

阅读更多...

Anaconda3简介与安装步骤

Anaconda3简介与安装步骤

目录 Anaconda3简介与功能 1.Anaconda3简介 2.主要功能和特点 3.使用场景 4.总结 Anaconda3安装 1.Anaconda3下载 1.1我的百度网盘 1.2官网下载 1.2.1访问官网 1.2.2输入邮箱 1.2.3登录你的邮箱下载（你的噶） 2.安装 2.1双击安装 2.2选择安…

阅读更多...

Linux——nginx 负载均衡

Linux——nginx 负载均衡

常规的web服务器一般提供对于静态资源的访问，比如说：图片、web样式网站提供的大部分交互功能都需要web编程语言的支持，而web服务对于程序的调用，不管编译型语言还是解释型语言，web服务同将对于应用程序的调用递交给通…

阅读更多...

路别走窄了，华为认证的这些方向，比数通值钱

路别走窄了，华为认证的这些方向，比数通值钱

华为认证作为全球领先的ICT技术认证之一，以其高标准和权威性在全球范围内受到认可。它不仅代表了专业技能的国际水平，更是IT专业人士职业生涯中的重要里程碑。但谈论起华为认证，似乎大家都默认首选数通。不止在华为认证，而是在整…

阅读更多...

Vue使用v-model收集各种表单数据、过滤器

Vue使用v-model收集各种表单数据、过滤器

目录 1. 使用v-model收集各种表单数据2. 日期格式化3. 过滤器 1. 使用v-model收集各种表单数据若<input type“text”/>，则v-model收集的是value值，用户输入的就是value值若<input type“radio”/>，则v-model收集的是value值&a…

阅读更多...

H5开发有哪些技巧？

H5开发有哪些技巧？

随着现代社会的飞速发展，网页开发已经从传统的HTML、CSS、JavaScript往H5发展。H5也称为HTML5，可以理解为是HTML的升级版，具有更加优秀的性能、更加完善的功能和更加多样的体验。因其灵活性和跨平台特性，成为了各类移动应用和网页…

阅读更多...

R语言报错 | object ‘integral‘ not found whilst loading name

R语言报错 | object ‘integral‘ not found whilst loading name

1、报错背景 Registered S3 method overwritten by htmlwidgets:method from print.htmlwidget tools:rstudio Error: package or namespace load failed for ‘Seurat’:object integral not found whilst loading namespace spatstat.core 当我想library&…

阅读更多...

sheng的学习笔记-AI-半监督学习

sheng的学习笔记-AI-半监督学习

AI目录：sheng的学习笔记-AI目录-CSDN博客基础知识什么是半监督学习我们在丰收季节来到瓜田，满地都是西瓜，瓜农抱来三四个瓜说这都是好瓜，然后再指着地里的五六个瓜说这些还不好，还需再生长若干天。基于这些信息&a…

阅读更多...

【Qt CMake】Qt5Widgets.dll:-1: error: LNK1107: 文件无效或损坏: 无法在 0x308 处读取

【Qt CMake】Qt5Widgets.dll:-1: error: LNK1107: 文件无效或损坏: 无法在 0x308 处读取

项目场景： CMake 编译QT 工程编译报错 E:\tool\Qt5.15.2\5.15.2\msvc2019_64\bin\Qt5Widgets.dll👎 error: LNK1107: 文件无效或损坏: 无法在 0x308 处读取问题描述 Cmkae 报错： E:\tool\Qt5.15.2\5.15.2\msvc2019_64\bin\Qt5Widgets.dll…

阅读更多...

Linux 数据结构链表

Linux 数据结构链表

1.段错误调试方法： 1.按照网上的方法配置Ubuntu，允许生成core文件 2.重新编译代码并加入-g选项(允许进行GDB调试) 3.ulimit -c unlimited 不限制core文件的生成的大小 4.执行代码,复现段错误,产生包含出错信息的core文件(检查cor…

阅读更多...

Android UI绘制原理：UI的绘制流程是怎么样呢？为什么子线程不能刷新UI呢？讲解大体的流程是怎么样的

Android UI绘制原理：UI的绘制流程是怎么样呢？为什么子线程不能刷新UI呢？讲解大体的流程是怎么样的

目录： 一、为什么要学习android UI绘制原理呢？对我们有什么帮助？ 1.解决复杂布局问题：了解UI绘制原理可以帮助我们更好地理解和解决布局问题，比如使用自定义View、优化布局层级等。 2.知道何时触发布局（…

阅读更多...

redis面试（二十五）CountDownLatch实现

redis面试（二十五）CountDownLatch实现

CountDownLatch最基本的原理，就是用来阻塞线程的，java本身也有CountDownLatch，用多线程处理分批处理多数据的时候很有用基本的逻辑就是，同时开多个子线程，然后主线程进入等待，只有当其他子线程全都结束之…

阅读更多...

JAVA后端框架【spring】--超详解

JAVA后端框架【spring】--超详解

什么是spring? spring是一个轻量级的ioc和Aop的一站式java开发框架，简化企业级开发轻量级：框架体积小（核心模块） IOC IOC:inversion of control 控制反转把创建对象的控制权反转给spring框架 AOP Aop:面向切面编程将程…

阅读更多...

pnpm 查看库的所有版本

pnpm 查看库的所有版本

1、最近在做图布局的时候，发现默认版本是beta版 2、那么我们如何来查看远程库中有什么版本可以安装呢？ 3、使用命令： pnpm view antv/layout versions pnpm view 这里替换成要查看的库名 versions

阅读更多...

最新文章

推荐文章