继续!从顶会论文看对比学习的应用!

3afc19ae647be0bd84209a7a2ca9b395.png

公众号作者@上杉翔二         

悠闲会 · 信息检索  

整理 | NewBeeNLP

上周,我们分享了对比学习的一些应用,从顶会论文看对比学习的应用!

本篇博文将继续整理一些对比学习的应用,主要是集中在MoCo和SimCLR等模型。

1、LCGNN

MoCo架构。基于标签对比编码的图分类图神经网络。

  • 论文:Label Contrastive Coding based Graph Neural Network for Graph Classification

  • 地址:https://arxiv.org/abs/2101.05486

一般做图分类的方法也是先学图的表示,主要有两种 ①先算node Embedding再聚合;② 直接graph Embedding,然后再做图分类。但是作者认为这些方法忽略了实例级的细粒度,而实例之间的判别式信息粒度更细有利于图分类任务。

3bfa456922ca0700ae01bc44e95345ed.png为了更有效、更全面地利用标签信息,提出基于标签对比编码的图神经网络(LCGNN),具体来说就是利用自监督学习中提出的标签对比损失来促进实例级的类内聚合性和类间可分性。

模型图如上图,基本上来说,LCGNN就是仿照的MoCo架构引入了动态标签存储库和动量更新编码器。

  • 输入是key graphs和query graphs。

  • Graph encoder考虑两种,1是Graph Isomorphism Network(GIN),同构图就是简单GNN然后Sum聚合。2是Hierarchical Graph Pooling with Structure Learning (HGP-SL),它可以将图池化和结构学习结合到一个统一的模块中以生成图的层次表示。

  • 后面的部分就和MoCo一致了。有一个Memory Bank,然后Momentum Update。

  • 最后的loss有label constructive和classification组成。

这个设计本质上可以被认为是一种标签增强。然后将具有相同标签的实例拉近,而具有不同标签的实例将相互推开。

2、VideoMoCo

来自CVPR21的文章,架构也是基于MOCO,任务是无监督视频表示学习。

  • 论文:VideoMoCo: Contrastive Video Representation Learning with Temporally Adversarial Examples

  • 地址:https://arxiv.org/abs/2103.05905

  • 代码:https://github.com/tinapanpt/VideoMoCo

1f364a0e446f85fd18e0eb75a293c921.png主要的架构如上图,也比较好理解,就是对出视频序列从两个视角改善MoCo的时间特征表示,如上图的ab或者cd,其中一个视角是通过丢弃帧来完成的,主要涉及到:

  • 生成器。在时间上删除几个帧,且是自适应地丢弃不同的帧,这通过时间衰减来完成。

  • 鉴别器。完成特征表示,无论帧移除如何。

然后对两个view进行类似MoCo的对比学习。即使用时间衰减来模拟内存队列中的键(key)衰减,其中动量编码器在键进入后进行更新,当使用当前输入样本进行对比学习时,这些键的表示能力会下降。这种下降通过时间衰减反映出来,以使输入样本进入队列中的最近键。

3、GraphCL

上一篇是MoCo思路,这一篇来自NIPS20的文章GraphCL则和SimCLR的思路一样的,即用各种各样的数据增强方法之后再对比学习。

  • 论文:Graph Contrastive Learning with Augmentations

  • 地址:https://arxiv.org/abs/2010.13902

  • 代码:https://github.com/Shen-Lab/GraphCL

df01eb823cedb03d219090b7929e9e15.png动机是传统的Graph模型会有over-smoothing or information loss这种问题,所以作者认为开发预训练技术是很有必要的。完整架构如上图,基本就是SimCLR的套路了。其中而GraphCL开发了4种增强的模式:

  • 节点丢弃。随机丢弃某些部分顶点及其连接。这意味着缺少部分顶点不影响图的语义。

  • 边扰动。通过随机添加或丢弃一定比例的边来扰动图中的连接性。这意味着边的连接模式具有一定的鲁棒性。

  • 属性掩码。使用其上下文信息(即剩余属性)恢复masked的顶点属性。基本假设是缺少部分顶点属性不会对模型预测产生很大影响。

  • 子图。使用随机游走采样一个子图,它假设图的语义可以在局部结构中得到很大的保留。

属性增强完成后,用GNN来encoder(即图中的黄色部分),然后再Projection head,Contrastive loss,这一些就和SimCLR一样了。

4、XMC-GAN

来自CVPR 2021:

  • 论文:Cross-Modal Contrastive Learning for Text-to-Image Generation

  • 地址:https://arxiv.org/abs/2101.04702v2

这篇的应用场景是用于文本到图像的生成。整体的架构也和SimCLR很像。首先由于背景是跨模态图像生成,所以对于生成的图片要求输出

  • 连贯的。文本和图片的语义要整体匹配。

  • 清晰的。图像的局部也是可识别,且和文本的词一致。

  • 还原度高的图片。在条件一致时生成图像应该与真实图像相似。77ce500f05cd5321d4dfb6e2676efd19.png为了解决这个问题,作者提出了一个基于最大化图像和文本之间互信息的跨模态对比生成对抗网络(XMC-GAN)。具体架构如上图,XMC-GAN使用了一个注意力自调节生成器用于加强文本-图像之间的对应关系(其实就是将噪音,词注意力,整体表征融合,具体如上半部分图的套娃),同时使用了一个对比判别器用作对比学习的特征抽取器,这里设计了三种以强制对齐生成的图像和文本:

  • 从图像到句子。直接算特征的对比损失。

  • 图像区域到单词。计算句子中所有单词与图像中所有区域之间的成对余弦相似矩阵,然后算对比损失。

  • 图像到图像对比损失。算真图像和假图像的对比损失。

5、ContraD

  • 论文:TRAINING GANS WITH STRONGER AUGMENTATIONS VIA CONTRASTIVE DISCRIMINATOR

  • 地址:https://arxiv.org/abs/2103.09742

  • 代码:https://github.com/jh-jeong/ContraD

ICLR2021的文章,把GAN和对比学习也结合起来,做一个对比形式的判别器吧。特别是关于GAN的数据增强技术是可以在一定程度上稳定GAN训练,所以看起来对比学习+GAN是很合适的搭配。

ebf3673fb423f9415241693870d341ae.png所以沿着增强的思路,这篇文章也是SimCLR的一类,模型架构如上,生成器可以得到多个样本,然后一起被送到D中,主要的贡献就是提出了Contrastive Discriminator (ContraD)。

ContraD的主要目标不是最小化GAN的鉴别器损失,而是学习一种与GAN兼容的对比表示。这意味着目标不会破坏对比学习,而表示仍然包含足够的信息来区分真实和假样本,因此一个小的神经网络鉴别器足以对表示执行其任务。

loss的组成由两部分,一个是SimCLR的loss,同时因为需要分清正负样本仅仅对比学习也是不够的,所以仍然需要dis loss来辅助训练。

一起交流

想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定o要备注信息才能通过)

a3775f4e8ef46741dbbf4bb65dbb1542.png

END -

3f87002f094bf2020195cb9ef54b2d7f.png

fca3ecfddfc2a3a0df6b6815db0e5d62.png

京东:个性化语义搜索在电商搜索中的应用

2021-11-24

a4084b68c4acbc6eb27920f14b335b8f.png

KDD 2021 | 推荐系统论文集锦[持续更新]

2021-11-16

657d065344486a41d92e6fd4b9b4741a.png

NLP 语义匹配:经典前沿方案整理

2021-11-10

8808520d175e9998fe56917c95a74c54.png

高效深度学习:让模型更小、更快、更好!

2021-11-03

0c5ed2dc2a54097b90447a28c9eb9466.png

a58fd9d594bcb467de5cb94ebec5c826.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/44581.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

知乎采集问答栏目以及文章教学

知乎文章质量怎么样 现在的年轻人越来越多的人喜欢知乎了,因为知乎平台的质量越来越高,我自己就比较喜欢使用知乎,很多问题我喜欢看知乎的答案,不喜欢看其它平台的,原因就是因为知乎的答案更权威,更靠谱一…

短视频自导自演,分镜脚本如何设计

前言: 在进入主题之前我先强调一下,这篇完全是番外,小编的主线还是以编码类为重的文章。至于原因有两点,一是距离上次更新到现在已经快一个月,所以先总结一下近期玩的东西补上。二是我确实正在再次尝试做短视频&#x…

制作钓鱼网站(克隆网站)

克隆网站主要指模仿相关网页的页面格式,自己制作页面颜色、标识均与原网站视觉效果相同,且域名差别不大,被用于谋取利益的非法网站。 利用social-enginner-toolkit(set)可制作多种钓鱼网站,下面是其中一种:获取用户凭证信息的网站。 准备:kali linux(IP192.168.xx…

Thonny编辑器介绍

相信很多在学习python的朋友都纠结,到底选哪个编辑器(IDE)好呢,下面给大家推荐一个编辑器————Thonny: Thonny编辑器是一个很简洁的编辑器,UI设计也很好看,虽然很简洁,但是它的功…

使用SniperPhish进行电子邮件钓鱼

关于SniperPhish SniperPhish是一款专为渗透测试人员以及安全研究专家设计的网络钓鱼研究工具,其主要目的是为了通过模拟真实场景中的网络钓鱼攻击来提升用户的安全保护意识。SniperPhish可以将研究人员创建的钓鱼网站和钓鱼邮件绑定在一起,以实现集中跟…

一款可以阻止网络钓鱼诈骗的解决方案?

“你继承了一笔财富。要转账,我需要你的银行账户凭证。” 你是否也遇见过此类的电话诈骗话术。 根据2022年数据泄露调查报告,25%的数据泄露涉及网络钓鱼。 这是怎么发生的?参与网络钓鱼的欺诈者一般都是心理方面的高手。他们知道如何营造紧…

甲方安全之仿真钓鱼演练(邮件+网站钓鱼)

文章目录 一、简介1.1 前言1.2 整体思路1.3 演练所需1.4 各邮件厂商日群发上限 二、钓鱼平台搭建及配置2.1 gophish平台搭建2.2 收件目标配置(User & Groups)2.3 发信邮箱配置(Sending Profiles)2.4 邮件模版配置(…

如何识别钓鱼邮件

今天,带大家来防御钓鱼邮件。 钓鱼邮件,即一种伪造邮件,是指利用伪装的电子邮件,来欺骗收件人点击恶意URL,或诱导收件人下载带恶意程序的可执行文件。 对于恶意URL,通常会伪装成和真实网站一样,…

【自制】我造了一台 钢 铁 侠 的 机 械 臂 !【硬核】

有人说:一个人从1岁活到80岁很平凡,但如果从80岁倒着活,那么一半以上的人都可能不凡。 生活没有捷径,我们踩过的坑都成为了生活的经验,这些经验越早知道,你要走的弯路就会越少。

识别钓鱼邮件小技巧

先在收邮件时自动识别出外部邮件,然后再去甄别。 以Foxmail邮件客户端为例—— 1、点击右上角“设置”按钮——选择“工具”——选择“过滤器” 2、选择将过滤策略所希望应用于的邮件账户,点击“新建”。 (1)设置一个过滤器名…

C#小游戏—钢铁侠VS太空侵略者

身为漫威迷,最近又把《钢铁侠》和《复仇者联盟》系列又重温了一遍,真的是印证了那句话:“读书百遍,其意自现”。看电影一个道理,每看一遍,都有不懂的感受~ 不知道大伙是不是也有同样的感受,对于…

学习JavaEE过程中遇到的各种(奇葩)问题

学习JavaEE过程中遇到的各种(奇葩)问题 问题一: The superclass “javax.servlet.http.HttpServlet” was not found on the Java Build Path 遇到这个问题的时候我尝试在网上找答案按着答案一步步操作。 这是在按着网上答案来的正确流程&a…

奇葩算法系列——猴子排序

首先我们介绍无限猴子定理 无限猴子定理最早是由埃米尔博雷尔在1909年出版的一本谈概率的书籍中提到的,此书中介绍了“打字的猴子”的概念。无限猴子定理是概率论中的柯尔莫哥洛夫的零一律的其中一个命题的例子。大概意思是,如果让一只猴子在打字机上随…

Maven项目中遇到的奇葩问题

场景描述 开发项目搞环境是一个非常蛋疼的问题,总是会遇到各种奇葩的问题,今天就遇到了一个跟Maven有关的。新开发一个项目,从SVN下载下来项目之后,pom.xml中Spring相关的Jar包就一直报如下红叉 后来发现我的maven 中是已经有…

你所遇到过得奇葩的需求

在网上看到大家在谈论碰到过的奇葩需求,看着看着一天的劳累都被欢乐冲散了,特地搜集大家的留言,整理出来,给大家分享一下,希望也能给你的生活添加点乐子,哈哈哈。 0、部门老大:你,做…

PVE7更新AQC107网卡驱动,解决奇葩问题。

背景介绍 前段时间自己组装了一台生产力,期间在TB买了张AQC107的万兆电口网卡,回来后发现在PVE7环境下每次重启或启动后网卡总是没反应或者不会自动协商到10G,拔下来插到win主机上没问题,基本确定是驱动的问题,那么就着…

html文档中引入axios遇到的奇葩问题

html文档中引入axios遇到的奇葩问题 在body中引入代码&#xff1a; <script src"https://unpkg.com/axios/dist/axios.min.js"></script>然后插入一个按钮&#xff1a; <input type"button" value"get请求" class"get&qu…

奇葩问题☞ npm install 报错 gyp ERR

gyp ERR! node -v v16.13.1 gyp ERR! node-gyp -v v3.8.0 gyp ERR! not ok 直接看图吧&#xff0c;咱也是第一次遇见这种错误&#xff0c;怎么办&#xff01;&#xff01;&#xff01; 于是百度了好久&#xff0c;尝试了好几种方法&#xff0c;但都不行。 比如&#xff1a;第一…

奇葩问题 npm install 报错 gyp ERR

gyp ERR! node -v v16.13.1 gyp ERR! node-gyp -v v3.8.0 gyp ERR! not ok 直接看图吧&#xff0c;咱也是第一次遇见这种错误&#xff0c;怎么办&#xff01;&#xff01;&#xff01; 于是百度了好久&#xff0c;尝试了好几种方法&#xff0c;但都不行。 比如&#xff1a;第一…

Java岗大厂面试百日冲刺 - 日积月累,每日三题【Day18】—— 奇葩问题合集

大家好&#xff0c;我是陈哈哈&#xff0c;北漂五年。认识我的朋友们知道&#xff0c;我是非科班出身&#xff0c;半路出家&#xff0c;大学也很差&#xff01;这种背景来北漂&#xff0c;你都不知道你会经历什么&#x1f643;&#x1f643;。   连续17天的技术文想必也是快吐…