9篇论文速览 ICML 2023 测试时自适应(TTA)最新研究进展

测试时自适应对于领域转移下真实机器感知应用的成功至关重要,近年来,研究者们仍然在不断优化现有的方法。在今年的ICML中,TTA相关的研究也有了最新进展。

1.Uncovering Adversarial Risks of Test-Time Adaptation

标题:揭示测试时适应的对抗风险

内容:最近,测试时适应(TTA)被提出作为解决分布漂移的有望解决方案。它允许基模型在推理期间利用测试批次中的信息适应未知分布。但是,作者揭示了TTA基于这样的洞见存在新的安全漏洞:良性样本的预测会受到同一批次中恶意样本的影响。为了利用这个漏洞,作者提出了分布入侵攻击(DIA),它向测试批次注入少量恶意数据。DIA导致使用TTA的模型将良性和未经扰动的测试数据错误分类,为对手提供了一种在规范机器学习流水线中不可行的完全新能力。通过全面评估,作者证明了攻击对六种TTA方法在多个基准上的高效性。为应对这一漏洞,作者研究了两个对策来增强现有不安全的TTA实现,遵循“安全设计”的原则。

2.On Pitfalls of Test-Time Adaptation

标题:测试时间自适应的陷阱

内容:测试时间自适应(TTA)最近出现作为一种解决分布转移鲁棒性挑战的有希望的方法。但是,先前文献中缺乏一致的设置和系统的研究,阻碍了对现有方法的彻底评估。为解决这个问题,作者提出了TTAB,一个测试时间自适应基准,它包含十种最先进的算法,各种分布转移和两种评估协议。通过大量的实验,该基准揭示了先前工作中的三个常见陷阱。第一,由于在线批处理依赖性,选择适当的超参数,特别是用于模型选择,非常困难。第二,TTA的有效性在很大程度上取决于所调整的模型的质量和属性。第三,即使在最佳的算法条件下,现有的方法也无法解决所有常见类型的分布转移。

3.Leveraging Proxy of Training Data for Test-Time Adaptation

标题:利用训练数据代理进行测试时适应

内容:TTA的常见做法是忽略训练数据,以减少内存需求和隐私泄露。但是,训练数据是唯一的监督来源。这促使作者研究恰当地使用它们的方法,同时最小化副作用。为此,作者提出了训练数据的两个轻量级且信息丰富的代理,以及一个充分利用它们的TTA方法。代理之一由少量通过数据浓缩合成的图像组成,它们最小化了域特定性以捕获广泛域的一般潜在结构。然后,在TTA中,通过调整它们的样式以匹配无标签测试样本的样式,将它们转换为标记的测试数据,这实现了虚拟的测试时训练。另一个代理是训练数据的类间关系,在TTA期间转移到目标模型。在四个公共基准测试上,我们的方法以显著更少的计算和内存优于最先进的方法。

4.Learnability and Algorithm for Continual Learning

标题:持续学习的可学习性与算法

内容:本文研究了类增量学习(CIL)这一具有挑战性的持续学习设置。CIL学习一系列由不相交的概念或类构成的任务的序列。在任何时间点,都会构建一个单一模型,该模型可以对至今学习过的任何类的测试实例进行预测/分类,而无需为每个测试实例提供任何任务相关信息。尽管已为CIL提出许多技术,但它们大多是经验性的。最近证明,一个强大的CIL系统需要对每个任务具有强大的任务内预测(WP)和出分布(OOD)检测。然而,CIL是否可学习性仍未可知。本文证明CIL是可学习的。基于该理论,还提出了一种新的CIL算法。实验结果证明了其有效性。

5.Test-time Adaptation with Slot-Centric Models

标题:基于槽位的模型的测试时适应

内容:当前的视觉检测器在训练分布内的表现虽然令人印象深刻,但在分布外的场景中解析实体时往往会失败。最近的测试时间自适应方法使用辅助自监督损失来独立地对每个测试示例的参数进行自适应,在图像分类任务中对训练分布之外的泛化显示了有希望的结果。作者发现这些损失本身对于场景分解任务是不够的,如果不考虑建模的归纳偏差。最近的以slot为中心的生成模型试图通过重建像素以自监督的方式分解场景成实体。汲取这两条研究路线的精华,作者提出了Slot-TTA,这是一个半监督的以slot为中心的场景分解模型,在测试时通过对重建或跨视觉合成目标进行梯度下降对每个场景进行自适应。作者评估了Slot-TTA跨多个输入模式(图像或3D点云),并展示了相对于最先进的监督前馈检测器和其他测试时间自适应方法的重大分布外性能改进。

6.Theory on Forgetting and Generalization of Continual Learning

标题:持续学习遗忘和泛化理论

内容:持续学习(CL)旨在学习一系列任务,最近受到广泛关注。但是,大多数工作集中在CL的实验表现,理论研究还比较有限。特别是对影响“灾难性遗忘”和泛化性能的关键因素还缺乏理解。为弥补这一空白,作者在过参数化线性模型下的理论分析首次给出了预期遗忘和泛化误差的显式形式。进一步分析这个关键结果产生了许多理论解释,阐明了过参数化、任务相似性和任务顺序如何影响CL的遗忘和泛化误差。更有趣的是,通过在真实数据集上使用深度神经网络(DNN)进行实验,作者发现一些见解甚至超越了线性模型,可以延伸到实际设置。

7.Test-Time Style Shifting: Handling Arbitrary Styles in Domain Generalization

标题:测试时风格转换:处理域泛化中的任意风格

内容:作者提出了测试时风格迁移,在进行预测之前,它会将测试样本(与源域有较大风格差异的样本)的风格转换为模型已经熟悉的最相近的源域的风格。这种策略使得模型可以处理任意风格统计的目标域,而无需在测试时进行额外的模型更新。另外,作者提出了风格平衡,它为最大限度地发挥测试时风格迁移的优势提供了一个很好的平台,通过处理DG特有的不平衡问题。作者提出的思想很容易实现,并且可以与各种其他DG方案成功配合使用。不同数据集上的实验结果证明了该方法的有效性。

8.Learning Rate Schedules in the Presence of Distribution Shift

标题:分布变化下的学习率调度

内容:作者设计了学习率调度方案,以最小化SGD在线学习在数据分布变化的情况下的遗憾。通过创新的随机微分方程分析完全表征了线性回归的最佳学习率调度。对于一般的凸损失函数,作者提出了鲁棒的学习率调度,给出了遗憾的上下界,仅差一个常数。对于非凸损失函数,作者定义了基于估计模型的梯度范数的遗憾概念,并提出了最小化总预期遗憾上界的学习率调度。直觉上,变化的损失景观需要更多的探索,作者确认最佳学习率调度通常在分布变化时增加。

9.Nonparametric Density Estimation under Distribution Drift

标题:分布漂移下的非参数密度估计

内容:作者研究了非平稳漂移设置下的非参数密度估计。给定从随时间逐渐变化的分布中采样的独立样本序列,目标是计算当前分布的最佳估计。作者证明了离散和连续光滑密度的紧致最小最大风险界,其中最小值是所有可能的估计量,最大值是满足漂移约束的所有可能分布。作者的技术处理广泛的漂移模型,并推广了之前关于漂移下无知学习的结果。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“TTA”获取全部论文PDF+代码合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/84025.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java 常用编辑器 IntelliJ IDEA

文章目录 IDEA 概述IDEA 下载和安装IDEA 中的第一个代码IDEA 的项目和模块操作(一)类的操作(二)模块的操作(三)项目的操作 IDEA 概述 IntelliJ IDEA是一款由JetBrains开发的集成开发环境(IDE&am…

git【潦草学习】

初始配置git 查询版本号 初次使用git前配置用户名与邮箱地址 git config --global user.name "your name" git config --global user.email "your email" git config -l 发现最后两行多出了用户名和邮箱,说明配置成功

玩机搞机---安卓新机型payload.bin刷写救砖 无需专用线刷包

目前的新机型官方卡刷包解包后都是payload.bin分区格式的卡刷固件。而有个别一些机型没有线刷包,当这些机型出现系统问题的时候有以下几种方法参考救砖。遇到类似故障的朋友可以借鉴参考下. 其中的不足和相关的资源可以参考这两个博文。任何教程的目的只是拓展你的…

多个配置WebMvcConfigurationSupport失效问题

最近在项目中用类继承WebMvcConfigurationSupport实现拦截器 Configuration RequiredArgsConstructor public class SpringWebSupport extends WebMvcConfigurationSupport {private final ProjectInterceptor projectInterceptor;// 拦截器 //设置拦截器对象和拦截请求Ove…

【广州华锐视点】VR燃气轮机故障判断模拟演练系统

VR燃气轮机故障判断模拟演练系统由广州华锐视点开发,是一款基于虚拟现实技术的教育工具,旨在为学生提供一个安全、高效、互动的学习环境,帮助他们更好地掌握燃气轮机的故障诊断技能。 这款VR实训软件能够模拟真实的燃气轮机故障诊断场景&…

章节4:JavaScript操作Cookie

章节4:JavaScript操作Cookie 直接利用Cookie登录 JavaScript语法 获取:document.cookie; 设置:document.cookie“usernamexx”; 删除:document.cookie“usernamexx;expiresThu, 01 Jan 1970 00:00:00 GMT”;

C语言进阶第二课-----------指针的进阶----------升级版

作者前言 🎂 ✨✨✨✨✨✨🍧🍧🍧🍧🍧🍧🍧🎂 ​🎂 作者介绍: 🎂🎂 🎂 🎉🎉&#x1f389…

图像的转置之c++实现(qt + 不调包)

1.基本原理 图像的转置就是将图像的横坐标和纵坐标交换位置,和矩阵的转置是一样的,公式见下: 2.代码实现(代码是我以前自学图像处理时写的,代码很粗糙没做任何优化,但很好理解) /*图像的转置函…

Qt画波浪球(小费力)

画流动波浪 #ifndef WIDGET3_H #define WIDGET3_H#include <QWidget> #include <QtMath> class widget3 : public QWidget {Q_OBJECT public:explicit widget3(QWidget *parent nullptr);void set_value(int v){valuev;}int get_value(){return value;} protecte…

nginx负载均衡

目录 负载均衡 nginx的七层代理和四层代理 四层代理与七层代理之间的区别 四层和七层谁的速度快&#xff1f; 正向代理与反向代理 负载均衡 upstream 算法 算法总结 stream 负载均衡 通过反向代理来实现 nginx的七层代理和四层代理 七层是最常用的反向代理方式&am…

Excel---成绩相同者,名次并列排列,三步搞定

需求&#xff1a;一张成绩表&#xff0c;共341行(340条数据&#xff0c;第一条为标题)&#xff0c;根据成绩进行排序&#xff0c;成绩相同进行名次并列 一、选择生成结果的位置&#xff0c;我这里点击了一下E2单元格 二、公式—>插入–>rank函数 数值&#xff1a;D2 表示…

SpringBoot 简单入门部署

1. 环境要求 Java 8 (配置环境变量)Maven 3.3idea 2019.1.2 及以上 1.1 maven 配置 <mirrors><mirror><id>nexus-aliyun</id><mirrorOf>central</mirrorOf><name>Nexus aliyun</name><url>http://maven.aliyun.com/n…

Spring源码——初识Spring容器

Spring源码之工厂&#xff08;容器&#xff09; 为什么把Spring的工厂又叫做容器呢&#xff1f; 工厂的责任是创建对象&#xff0c;但是创建完对象后还要进行存储&#xff08;针对于单例的对象来讲&#xff09;&#xff0c;以供其他地方使用&#xff0c;这就是容器。为了能存…

Redis布隆过滤器的原理和应用场景,解决缓存穿透

目录 一、redis 二、布隆过滤器 三、缓存穿透问题 四、布隆过滤器解决缓存穿透 一、redis Redis&#xff08;Remote Dictionary Server&#xff09;是一种开源的内存数据存储系统&#xff0c;也是一个使用键值对&#xff08;Key-Value&#xff09;方式的高性能数据库。Red…

vscode插件不能搜索安装

1 现象 vscode搜索自己的插件&#xff0c;报错&#xff1a; Error while fetching extensions. HXR failed2 原因 之前用vscode开发golang语言&#xff0c;设置了proxy代理&#xff0c;所以导致错误&#xff0c;删除即可 重启vscode 3 结果

后端进阶之路——Spring Security构建强大的身份验证和授权系统(四)

前言 「作者主页」&#xff1a;雪碧有白泡泡 「个人网站」&#xff1a;雪碧的个人网站 「推荐专栏」&#xff1a; ★java一站式服务 ★ ★前端炫酷代码分享 ★ ★ uniapp-从构建到提升★ ★ 从0到英雄&#xff0c;vue成神之路★ ★ 解决算法&#xff0c;一个专栏就够了★ ★ 架…

2542. 最大子序列的分数

题目描述&#xff1a; 主要思路&#xff1a; 这是一个堆的题目&#xff0c;首先将2里边的下标按照数值递减的顺序进行重新排列。依次遍历2的下标同时加上1的数值&#xff0c;堆里边存储1的大小。 class Solution { public:long long maxScore(vector<int>& nums1, …

企业权限管理(五)-订单分页

订单分页查询 PageHelper介绍 PageHelper是国内非常优秀的一款开源的mybatis分页插件&#xff0c;它支持基本主流与常用的数据库&#xff0c;例如mysql、oracle、mariaDB、DB2、SQLite、Hsqldb等。 PageHelper使用 集成 引入分页插件有下面2种方式&#xff0c;推荐使用 Maven …

学习网络基础No.2【深入理解TCP/IP】

引言&#xff1a; 北京时间&#xff1a;2023/8/9/13:04&#xff0c;昨天在摆烂中把网络基础相关知识的博客更新&#xff0c;依然还是上不了C站热榜&#xff0c;我估计是因为我账号热度不够没有上榜资格&#xff0c;也可能是因为前段时间没有积极更新&#xff0c;导致周榜被甩出…

原型模式与享元模式:提升系统性能的利器

原型模式和享元模式&#xff0c;前者是在创建多个实例时&#xff0c;对创建过程的性能进行调优&#xff1b;后者是用减 少创建实例的方式&#xff0c;来调优系统性能。这么看&#xff0c;你会不会觉得两个模式有点相互矛盾呢&#xff1f; 在有些场景下&#xff0c;我们需要重复…