TIFS-2024 FIRe2:细粒度表示和重组在换衣行人重识别中的应用

总体结论

本文提出了一种新的细粒度表示与重构(FIRe2)框架,用于解决布变人重识别问题。通过细粒度特征挖掘和属性重构,FIRe2在不依赖任何辅助信息的情况下,实现了最先进的性能。该方法在多个基准数据集上取得了显著的成果,展示了其在现实世界应用中的潜力。

优点与创新

  1. 提出了一个新的框架FIRe2,用于解决换衣人Re-ID问题,仅需RGB图像作为输入,能够提取身份相关和衣物无关的特征。
  2. 设计了一个细粒度特征挖掘(FFM)模块,通过聚类获取每个人的细粒度伪标签和属性,并引入属性感知分类损失以促进细粒度表示学习。
  3. 提出了一个细粒度属性重构(FAR)模块,通过在潜在空间中重构不同属性的图像特征来有效地丰富特征表示。

不足与反思

  1. 聚类操作可能会在训练过程中带来额外的内存消耗和时间成本,聚类的质量可能会影响最终结果。
  2. 未来将探索更先进的属性聚类和重构方法,以期实现更大的改进。

关键问题及回答

问题1:细粒度特征挖掘(FFM)模块是如何设计的?它在细粒度学习中的作用是什么?

细粒度特征挖掘(FFM)模块通过聚类分别对每个人的图像进行聚类。具体来说,首先构建一个CNN模型来提取图像特征,然后使用DBSCAN算法对这些特征进行聚类。聚类过程中不需要预先指定聚类数目,DBSCAN算法会根据数据本身的相似性自动形成聚类。聚类完成后,每个聚类会被赋予一个细粒度伪标签,这些标签在不同的人之间不共享。通过引入属性感知的分类损失,模型被鼓励学习到与这些伪标签相关的细粒度特征,从而提升身份相关特征的辨别力。

问题2:细粒度属性重构(FAR)模块是如何工作的?它在特征增强方面的效果如何?

细粒度属性重构(FAR)模块通过在潜在空间中重构不同属性的图像特征来增强鲁棒的特征学习。具体操作是,采用实例归一化来解耦输入图像的原始属性,然后在同一批次的图像之间重构不同的属性。例如,对于输入图像的某个部位,先计算其均值和标准差,然后将这些属性替换为来自其他图像的新属性。通过这种方式,模型能够学习到更加丰富和多样的特征表示,从而提高对不同衣物变化的鲁棒性。实验结果表明,FAR模块在布变设置下能够带来2.9%到4.3%的Rank-1准确率和mAP提升。

问题3:FIRe2方法在多个数据集上的表现如何?它是如何验证其有效性的?

FIRe2方法在五个广泛使用的布变人重识别基准上进行了评估,包括PRCC、LTCC、Celeb-reID、DeepChange和LaST。在PRCC数据集上,FIRe2在标准设置和布变设置下分别达到了65.0%和63.1%的Rank-1准确率和mAP。在LTCC数据集上,FIRe2在标准设置和布变设置下分别达到了44.6%和19.1%的Rank-1准确率和mAP。在Celeb-reID数据集上,FIRe2在没有衣物注释的情况下,Rank-1准确率和mAP分别达到了64.0%和18.2%。在DeepChange和LaST数据集上,FIRe2也表现出色,分别超越了ResNet-50基线和ViT-B/16模型,并在LaST数据集上达到了75.0%的Rank-1准确率和32.2%的mAP。通过这些结果,FIRe2展示了其在布变人重识别任务中的有效性。

研究背景

  1. 研究问题:这篇文章要解决的问题是布变人重识别(Re-ID),即在不同的摄像头下识别同一个人的身份。现有的方法主要依赖于辅助信息来促进身份相关特征的学习,但这些信息在现实应用中可能不可用。
  2. 研究难点:该问题的研究难点包括:缺乏具有辨别力的特征和有限的训练样本。现有方法通常利用形状或步态的软生物特征以及额外的衣物标签来辅助学习,但这些信息在现实世界中往往不可用。
  3. 相关工作:该问题的研究相关工作有:传统的短期场景下的人重识别方法、利用生成模型合成不同衣物的图像、利用辅助模态(如关键点、轮廓、步态和3D形状)的方法、以及最近利用轻量级衣物标签信息的方法。

研究方法

这篇论文提出了一种新的细粒度表示与重构(FIRe2)框架,用于解决布变人重识别问题。具体来说,

细粒度特征挖掘(FFM)模块:首先,设计了一个细粒度特征挖掘模块,通过聚类分别对每个人的图像进行聚类。相似细粒度属性(如衣物和视角)的图像被鼓励聚集在一起。引入了一个属性感知的分类损失,基于聚类标签进行细粒度学习,这些标签在不同的人之间不共享,促进了模型学习身份相关的特征。
 

细粒度属性重构(FAR)模块:为了充分利用细粒度属性,提出了一个细粒度属性重构模块,通过在潜在空间中重构不同属性的图像特征来增强鲁棒的特征学习。具体来说,采用实例归一化来解耦输入图像的原始属性,然后在同一批次的图像之间重构不同的属性。此外,分别重构输入图像的上半身和下半身属性,以丰富同一人的各种属性表示。
 

  1. 训练和推理过程:在早期训练阶段,模型倾向于通过区分容易样本学习粗略的粒度和容易的身份信息。提出的FFM和FAR模块鼓励模型学习细粒度的身份特征,因此在模型学习到不错的行人身份表示之前,仅使用基本的身份分类损失进行监督。然后逐渐添加其他项,包括常用的三元组损失、属性感知的分类损失和属性重构特征的交叉熵损失,以共同帮助模型学习鲁棒的细粒度身份特征。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/459857.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一款专业获取 iOS 设备的 UDID 工具|一键获取iPhone iPad设备的 UDID

什么是UDID? UDID,是iOS设备的一个唯一识别码,每台iOS设备都有一个独一无二的编码,这个编码,我们称之为识别码,也叫做UDID( Unique Device Identifier) 扫描后系统提示输入密码&am…

HTML--浮动布局练习

<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title><style>/* 整个浏览器页…

ES6 变量的解构赋值

数组的解构赋值 对象的解构赋值 字符串的解构赋值

利用游戏引擎的优势

大家好&#xff0c;我是小蜗牛。 在当今快速发展的游戏产业中&#xff0c;选择合适的游戏引擎对开发者来说至关重要。Cocos Creator作为一款功能强大且灵活的游戏引擎&#xff0c;为开发者提供了丰富的工具和资源&#xff0c;使他们能够高效地开发出优秀的游戏。本文将探讨如何…

Python+Selenium+Pytest+POM自动化测试框架封装(完整版)

&#x1f345; 点击文末小卡片 &#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 1、测试框架简介 1&#xff09;测试框架的优点 代码复用率高&#xff0c;如果不使用框架的话&#xff0c;代码会显得很冗余。可以组装日志、报告、邮件等一些高…

【鸿蒙HarmonyOS实战:通过华为应用市场上架测试版App实现HBuilder X打包的UniApp项目的app转hap教程(邀请码)方式教程详解】

鸿蒙HarmonyOS实战&#xff1a;通过华为应用市场上架测试版App实现HBuilder X打包的UniApp项目的app转hap教程&#xff08;邀请码&#xff09;方式详解 在使用uniapp打包的鸿蒙项目的过程中&#xff0c;由于生成的是app文件&#xff0c;而hdc传给鸿蒙HarmonyOS系统需要的是hap文…

【Apache Zookeeper】

一、简介 1、场景 如何让⼀个应⽤中多个独⽴的程序协同⼯作是⼀件⾮常困难的事情。开发这样的应⽤&#xff0c;很容易让很多开发⼈员陷⼊如何使多个程序协同⼯作的逻辑中&#xff0c;最后导致没有时间更好地思考和实现他们⾃⼰的应⽤程序逻辑&#xff1b;又或者开发⼈员对协同…

名词(术语)了解--SSR/CSR

名词&#xff08;术语&#xff09;了解–SSR/CSR 什么是服务器端渲染(SSR)? 服务器端渲染是指由服务器生成完整的 HTML 页面&#xff0c;然后发送给客户端的过程。 这与客户端渲染&#xff08;CSR&#xff09;形成对比&#xff0c;后者主要依赖浏览器端的 JavaScript 来渲染…

有趣智力题(非编程题)

目录 赛马烧香问题 赛马 题目描述: 一共有36匹马 6个跑道 在没有计时器的情况下 请问: 最少进行多少次赛马 可以确定前三名? 答案:8次 图解思路: 注意下图写错了 注释没写错 图画错了 正确的是下图 烧香问题 题目描述: 有两根香 材质不均匀 但是每一根香 烧完都需要1h 请利用…

学习threejs,使用粒子实现下雪特效

&#x1f468;‍⚕️ 主页&#xff1a; gis分享者 &#x1f468;‍⚕️ 感谢各位大佬 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍⚕️ 收录于专栏&#xff1a;threejs gis工程师 文章目录 一、&#x1f340;前言1.1 ☘️THREE.Points简介1.11 ☘️…

Golang | Leetcode Golang题解之第517题超级洗衣机

题目&#xff1a; 题解&#xff1a; func findMinMoves(machines []int) (ans int) {tot : 0for _, v : range machines {tot v}n : len(machines)if tot%n > 0 {return -1}avg : tot / nsum : 0for _, num : range machines {num - avgsum numans max(ans, max(abs(sum…

算法练习:209. 长度最小的子数组

题目链接&#xff1a;209. 长度最小的子数组。 这里ans来统计最小长度&#xff0c;所以初始值设置为INT_MAX.最后如果ans结果还是INT_MAX时&#xff0c;说明无此数组。 class Solution { public:int minSubArrayLen(int target, vector<int>& nums) {if (nums.size(…

WPF+MVVM案例实战(十一)- 环形进度条实现

文章目录 1、运行效果2、功能实现1、文件创建与代码实现2、角度转换器实现3、命名空间引用 3、源代码下载 1、运行效果 2、功能实现 1、文件创建与代码实现 打开 Wpf_Examples 项目&#xff0c;在Views 文件夹下创建 CircularProgressBar.xaml 窗体文件。 CircularProgressBa…

《贪婪算法实战:寻找最短无序连续子数组的深度解析与实现》

🚀 博主介绍:大家好,我是无休居士!一枚任职于一线Top3互联网大厂的Java开发工程师! 🚀 🌟 在这里,你将找到通往Java技术大门的钥匙。作为一个爱敲代码技术人,我不仅热衷于探索一些框架源码和算法技巧奥秘,还乐于分享这些宝贵的知识和经验。 💡 无论你是刚刚踏…

堆的基本概念和插入删除方法的介绍

优先级队列的介绍&#xff1a; 1.1优先级队列&#xff1a;优先级队列是一种特殊的队列数据结构&#xff0c;每个元素都有一个与之关联的优先级&#xff0c;与普通队列不同&#xff0c;优先级队列中的元素是按照优先级顺序进行处理的&#xff0c;而不是简单的插入。 特点&…

雷军:对“雷军语音包”感到不适,希望停止使用

对于社交媒体上频繁出现的“雷军AI语音包”&#xff0c;雷军发声回应。10月29日&#xff0c;雷军发布视频表示&#xff1a;“最近两年AI特别火&#xff0c;技术进步特别得快&#xff0c;前段时间我在刷抖音的时候&#xff0c;经常看到很多人在玩‘雷军AI’&#xff0c;就是雷军…

分布式光伏是什么意思?如何高效管理?

分布式光伏系统是指在用户现场或靠近用电现场配置较小的光伏发电供电系统&#xff0c;以满足特定用户的需求。根据通知&#xff0c;分布式光伏系统主要有以下几类定义&#xff1a; 10kV以下电压等级接入&#xff0c;且单个并网点总装机容量不超过6MW的分布式电源&#xff1a;这…

项目1 yolov5鱼苗检测计数

yolov5鱼苗检测 1. yolov5鱼苗检测1.1. 环境配置1.2 Predict1.3 Validate1.4 Train1.5 生成 ONNX 2 代码解析2.1 模型2.2 数据集2.3 损失函数2.4 训练2.5 预测 之前做的项目&#xff0c;再回顾一下 环境&#xff1a;GPU1卡&#xff0c;CPU4核&#xff0c;每显卡12GB&#xff0c…

智能文档处理平台:免费体验智能化医疗信息提取

前提&#xff1a;医疗行业信息碎片化问题普遍&#xff0c;手工数据录入效率低且易错&#xff0c;导致数据管理难度大。本系统可帮助医疗机构在信息管理上迈向智能化&#xff0c;优化流程并提升效率。 系统概述&#xff1a; 思通数科推出的智能文档处理系统&#xff0c;专为解…

解决edge浏览器无法同步问题

有时候电脑没带&#xff0c;但是浏览器没有同步很烦恼。chrome浏览器的同步很及时在多设备之间能很好使用。但是edge浏览器同步没反应。 在这里插入图片描述 解决方法&#xff1a; 一、进入edge浏览器点击图像会显示未同步。点击“管理个人资料”&#xff0c;进入后点击同步&…