再看SimCSE

一、概述

在这里插入图片描述

二、要点分析原始ppt解读

2.1 作用:语义表达作用检索+聚类

在这里插入图片描述

2.2 简述:简单的对比学习来做语义表征

  • 预训练+对比学习:最佳的语义表征方法
    • 无监督:dropout
    • 有监督:NLI 蕴含+矛盾数据
  • 原理:
    • 利用对比学习目标,将预训练的embedding进行uniform化
    • 利用监督数据,aligns对齐相同语句的embedding表达
      在这里插入图片描述

2.3 原理:对比学习原理

  • 拉近邻居,push非邻居
    在这里插入图片描述

2.4 目标函数:无监督学习目标函数

  • 正样本:相同句子,独立的dropout mask
  • 负样本:batch内,其他句子的embedding
    在这里插入图片描述

2.5 目标函数:监督学习目标函数

  • 正样本:NLI数据集 蕴含 样本
  • 负样本:batch内的负样本+矛盾样本,原来是两部分啊?相当于利用标注的负样本做了一个补充
    在这里插入图片描述

2.6 主要评估方法:语义相似度任务,而非下游文本分类任务

在这里插入图片描述

2.7 结果:无监督学习结果

在这里插入图片描述

2.8 结果:监督学习结果

在这里插入图片描述

2.9 原因分析:为啥能更好呢?构造无监督正样本对的方法不一样

  • SimCSE:dropout
  • 其他方法:
    • 下个句子增强
    • 同义词替换
    • crop
    • 删除
  • 优点总结:
    • 用他自己来做正样本>>下一个句子来做正样本
    • dropout增强>>其他数据增强
      在这里插入图片描述
      在这里插入图片描述

2.10 embedding表征特点分析:embedding各向异性分析

  • 预训练模型好的alignment,差的uniformity
  • 后处理可以改进uniformity
  • SimCSE:改进uniformity并且保持好的alignment性质
    在这里插入图片描述
    在这里插入图片描述

2.11 最终效果

在这里插入图片描述

2.12 总结

  • SimCSE:对比学习来做句子embedding
    • 无监督:标准dropout来做正样本对
    • 有监督:entailment做正样本,contradiction来做难样本
  • 原因:
    • 可以利用alignment和uniformity来分析不同的模型
    • 理论显示对比学习能改进embedding的uniformity​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/58769.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MIT最新成果:这款能「自我复制」的机器人,从飞机到火箭都能自己造!

来源:新智元 本文约2300字,建议阅读5分钟科幻成真!《超能陆战队》里能自我复制的微型机器人,被MIT造出来了? 现在的机器人,能力究竟有多离谱? 实在难以想象,就连造飞机、造火箭都成了…

PowerGram:一款功能强大的跨平台Telegram Bot工具

关于PowerGram PowerGram是一款功能强大的跨平台Telegram Bot工具,该工具基于纯PowerShell开发,支持在Windows、Linux和macOS系统上运行。如需使用PowerGram,只需要安装PowerShell 4或更高版本并连接网络即可。 Bot和Telegram服务器之间的所…

HackingTeam重磅炸弹: 估值超1000万美金带有军火交易性质的木马病毒以及远控源码泄露

[简介] 常用网名: 猪头三 出生日期: 1981.XX.XX 个人网站: http://www.x86asm.com QQ交流: 643439947 编程生涯: 2001年~至今[共14年] 职业生涯: 12年 开发语言: C/C、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python 开发工具: Visual Studio、Delphi、XCode、E…

Transformers 如何模仿大脑的某些部分

来源:ScienceAI 编译:白菜叶 了解大脑如何组织和访问空间信息「我们在哪里」,「拐角处有什么」,「如何到达那里」,这仍然是一项艰巨的挑战。该过程涉及从数百亿个神经元中调用整个记忆网络和存储的空间数据&#xff0c…

攻防世界_Crypto_告诉你个秘密

攻防世界刷题记录Crypto篇 文章目录 攻防世界刷题记录Crypto篇解题步骤1.下载题目附件查看内容2.借助Python来解码3.从键盘上找到每组字母包围的字母 解题步骤 1.下载题目附件查看内容 如图所示,题目附件给出的是一个txt文件里面有两行字符串。因为只有不超过F的大…

来自Transformer + Bert + GPT 的灵魂拷问

Transformer Q:Transformer如何解决梯度消失问题的? A:残差连接 Q:为何Transformer中使用Layer Normalization而不用Batch Normalization? A:BatchNorm是对一个batch-size样本内的每个特征做归一化,LayerNorm是对每…

基于tkwinter制作的exe小工具

前言 最近事没那么多,然后同事基于tkwinter制作了一款exe造单工具,感觉挺好玩的,然后叫同事分享了一下源码,自己去学习了tkwinter各大组件的相关语法及操作,所以写篇博客分享一下 同事款工具 下面是同事写的小工具&…

【WAX链游】发布一个免费开源的Alien Worlds【外星世界】合约脚本TLM

前言 《链游Farmers World【农民世界】爆火,发布一个免费开源的脚本》 在之前的文章中,我们分享了一个开源的农民世界(Farmers World)脚本 【OpenFarmer】:https://github.com/encoderlee/OpenFarmer 经过这段时间以来的不断学习&#xff…

量子计算机细思极恐,宇宙或许只是一套虚拟程序,科学家:还有一种可能细思极恐!...

原标题:宇宙或许只是一套虚拟程序,科学家:还有一种可能细思极恐! 我不知道你是否有过类似的经历:刚从沉睡中醒来,你周围的世界就有一种奇怪的虚幻和朦胧感,当意识浮出水面,你周围的事物就回到了…

【电力电子技术速通】五、DC-DC变流电路(一)Buck与Boost

一、概述 直流-直流变流电路也称斩波电路,并且斩波这种叫法更多一些。 可以分为直接直流变流电路和间接直流变流电路,最大的区别就是后者是隔离式的,通常用高频变压器隔离,所以也叫直-交-直电路。 斩波电路的三种控制方式&#…

TrickBot和Emotet再夺恶意软件之冠

根据Check Point Software的最新分析,僵尸木马TrickBot和Emotet是10月份最流行的恶意软件,这一趋势将推动勒索软件感染的激增。 Check Point通过ThreatCloud威胁情报系统传输的数据编制了2020年10月的全球威胁指数,据说该系统每天检查超过25亿…

元宇宙,会成为下一代互联网的主场吗?

导语 | 2022 年元宇宙风靡全网,作为过去一年科技界的“当红扛把子”,引多家科技巨头“竞折腰”。近日,《福布斯》双周刊网站在报道中指出,2030 年全球元宇宙的市场规模有望高达 5 万亿美元,2023 年可能是确定其发展方向…

必然还是炒作?从技术发展来看元宇宙

关于元宇宙,已经成为了2021年一个大火的名词,国外的Facebook(现Meta)、微软、英伟达……国内的腾讯、阿里、字节跳动……各大互联网巨头纷纷入局,甚至在11月12日,中国电信也表示将在2022年启动打造元宇宙基…

元宇宙持续火热的背景下,我们普通人如何赚钱

放眼全球,最近几年,能让互联网大厂像扑了蛾子一般向前冲的风口除了区块链、智能电动汽车,就是元宇宙。 尤其那些在区块链上没有吃到什么红利,造车运动又没参与上的互联网企业,对元宇宙似乎有一种执念。 这种执念让一…

即将到来的2023,国内元宇宙开始“割”企业了?

元宇宙爆火一年后,UTONMOS即将成为全球化全部实现ERC-721协议NFT链上垂直游戏价值生态的系统平台,旨在通过利用自身所拥有的各类头部资源和游戏化打造内容层的融合,建立一个元气满满的元宇宙Web3.0平台。 通过数字藏品技术的应用&#xff0c…

元宇宙将如何影响我们的投资、就业和生活方式?

【导读】 3月10日,Roblox在纽交所上市,成为元宇宙概念第一股,首日股价上涨54%,市值超过400亿美元。近日,Facebook创始人兼CEO扎克伯格表示,要在五年左右的时间里,将Facebook从一家社交媒体公司…

元宇宙热潮:缘起、影响与展望

当下科技界和产业界最热的话题非“元宇宙”莫属。2021年3月,“元宇宙第一股”美国网络游戏和社交平台公司Roblox在纽约证券交易所上市。10月,美国互联网巨头Facebook更名为“元”(Meta),宣告其强势进军元宇宙相关产业。…

2023年JDK要升级到多少?看看七家大模型给的答案

前言 在2023年很多公司应该还在用JDK8,目前JDK已经更新到JDK20,JDK21也将在2023年9月发布,那么在2023年如果我们要升级JDK,到底升级到哪个版本比较合适呢?这个问题我们可以交给大模型,看看各家大模型是怎么…

数据分析师的职场晋升

数据分析师怎么晋升?数据分析师的优势在哪?数据分析师的护城河在哪? 以上三个问题我相信很多数据相关的同学都有疑问。对于我(螺丝钉)来说,工作8年,现任数据负责人。分别做过SRE,数据运营和经营分析&#…

行业大洗牌,一大批数据分析师要失业了

数据分析师的尴尬处境 前段时间,我一个前同事离职了——他有4年的数据分析经验,却被强行安排到了运营部做数据日报,心态崩了。 我自己也是老数据分析师了,还是很理解这其中的苦衷。 论业务能力比不过运营,论技术水平比…