【机器学习300问】114、什么是度量学习?三元组损失又是什么?

        这些天都在加强自己的CV基本功,之前做过的人脸识别项目里有很多思考,在学习了这些基础知识后,我再次回顾了之前的人脸识别项目。我发现,很多之前困惑不解的问题现在都有了清晰的答案。

一、什么是度量学习?

        度量学习也称为距离度量学习或相似度学习。目标是学习有效的距离或相似度度量,使同类样本之间的距离小、不同类样本之间的距离大,以提高分类或聚类准确性。常见方法有对比学习、三元组学习和多视图学习,它们定义样本间距离或相似度,并优化模型参数。

二、三元组损失和度量学习什么关系?

(1)三元组损失函数的定义 

        三元组损失函数(Triplet Loss)是度量学习(Metric Learning)中常用的损失函数,通过最小化同类样本间的距离和最大化不同类样本间的距离来优化模型的度量。

        它的基本思想是通过最小化“锚点(Anchor)”、“正例(Positive)”和“负例(Negative)”这三个样本之间的相对距离来优化模型。具体来说:

  • 锚点(Anchor, A):是选取的一个样本。
  • 正例(Positive, P):与锚点属于同一类别,但不是同一个样本。
  • 负例(Negative, N):与锚点不属于同一类别。

三元组损失函数的数学表达式如下:

L(A,P,N)=max(0,d(A,P)-d(A,N)+\alpha)

符号解释
d表示两个样本在特征空间中的距离,通常使用欧氏距离或余弦距离等
d(A,P)表示锚点样本与正样本之间的距离
d(A,N)表示锚点样本与负样本之间的距离
\alpha是一个预先设定的边际(margin),用来确保正例与锚点的距离比负例与锚点的距离至少小\alpha
max如果这个条件不满足,损失函数的值就为两者之差加上\alpha,否则损失为0

(2)损失函数的优化目标

        目标是最小化锚点与正样本间的距离,同时最大化锚点与负样本间的距离。

三、对于余弦相似度而言三元组损失函数怎么表示?

        对于余弦相似度,三元组损失函数目的是确保一个“锚点”样本与其同类的“正例”样本之间的余弦相似度比与一个不同类的“负例”样本之间的余弦相似度至少大一个固定的边际。

(1)三元组损失函数的定义 

数学上这个目标可以表示为以下公式:

L(A,P,N)=max(0,cos(A,P)-cos(A,N)+m)

符号解释
L(A,P,N)三元组损失函数,衡量锚点、正例、负例之间的相似度差异
A锚点(Anchor)样本的特征向量,用于比较的基准
P正例(Positive)样本的特征向量,与锚点属于同一类别
N负例(Negative)样本的特征向量,与锚点属于不同类别
m边际(Margin),一个正数,确保正例与锚点的相似度显著高于负例与锚点的相似度
cos(x,y)余弦相似度函数,衡量向量x和y之间的方向相似性,取值范围为-1到1,值越接近1表示方向越相似

(2)损失函数的优化目标 

        损失函数的目的是最小化锚点与正例之间的余弦相似度差距,与锚点与负例之间的余弦相似度差距加上边际m之间的差值。

        当这个差值为负时,意味着负例与锚点的相似度大于正例与锚点的相似度加上边际,此时损失函数输出一个非零值,促使模型调整权重以增大同类样本间的相似度同时减小不同类样本间的相似度。当满足条件时,损失为0,无须更新模型参数。

四、度量学习和三元组损失在人脸识别任务中的应用

        度量学习在人脸识别任务中的应用主要是通过学习一个高维特征空间,在这个空间中,属于同一人的不同人脸图像的特征向量尽可能靠近,而不同人的特征向量则相隔较远。这样,通过比较两个人脸特征向量的距离,就可以判断它们是否属于同一人。

        在众多度量学习方法中,三元组损失函数是特别适用于人脸识别的常用方法之一。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/348010.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring框架是如何查找方法上的异步任务注解@Async

结论先行 Spring框架层面,查找方法上的注解的原理与机制是一样的。 在方法层面,Spring框架已经找到子类的Async注解,原因是查找注解会搜索整棵类型继承树,包括超类和实现的接口。 异步任务代码示例 Async注解,在父类…

0605 实际集成运算放大器的主要参数和对应用电路的影响

6.5.1 实际集成运放的主要参数 6.5.2 集成运放应用中的实际问题 6.5.2 集成运放应用中的实际问题

【python】tkinter GUI开发: Button和Entry的应用实战探索

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

Spark参数配置不合理的情况

1.1 内存设置 💾 常见的内存设置有两类:堆内和堆外 💡 我们作业中大量的设置 driver 和 executor 的堆外内存为 4g,造成资源浪费 📉。 通常 executor 堆外内存在 executor.cores1 的时候,1g 足够了&…

傲医医疗集成引擎 Rhapsody 在超融合信创平台表现如何?

作者:SmartX 商业团队 黄玉辉 随着越来越多的医疗用户基于超融合基础设施实现 IT 基础架构信创转型,超融合信创架构在医疗业务场景中的实际表现也得到更多关注。尤其是集成平台业务场景——作为三甲医院互联互通评级中不可缺少的核心业务系统&#xff0…

条件判断if语句与case语句

一、条件测试 test命令进行条件测试,然后根据返回值来判断条件是否成立。 常用操作符: -e :既可以测试文件又可以测试目录是否存在 -d :测试目录是否存在 -f :测试文件是否存在 -r :测试当前用户是否…

delmia中机器人末端固定工具

1 需要在工具上面建立点 在Device Building模式下 2 然后通过 set tool可以设置

618值得购买的东西有哪些?618四款必囤好物清单分享!

随着618购物狂欢节的脚步日益临近,身为数码领域的资深爱好者,我深感有必要为大家推荐一系列经过精心挑选的数码产品精选。无论是热衷于科技前沿的探索者,还是希望通过智能设备提升生活品质的时尚达人,本文所介绍的每一款数码产品都…

【ARM Cache 与 MMU/MPU 系列文章 2.1 -- 什么是 Cache PoP 及 PoDP ?】

请阅读【ARM Cache 及 MMU/MPU 系列文章专栏导读】 及【嵌入式开发学习必备专栏】 文章目录 PoP 及 PoDPCache PoDPCache PoP应用和影响PoP 及 PoDP Cache PoDP 点对深度持久性(Point of Deep Persistence, PoDP)是内存系统中的一个点,在该点达到的任何写操作即使在系统供电…

初级网络工程师之从入门到入狱(三)

本文是我在学习过程中记录学习的点点滴滴,目的是为了学完之后巩固一下顺便也和大家分享一下,日后忘记了也可以方便快速的复习。 中小型网络系统综合实战实验 前言一、详细拓扑图二、LSW2交换机三、LSW3交换机四、LSW1三层交换机4.1、4.2、4.3、4.4、4.5、…

SolidWorks 2016 SP5安装教程

软件介绍 Solidworks软件功能强大,组件繁多。 Solidworks有功能强大、易学易用和技术创新三大特点,这使得SolidWorks 成为领先的、主流的三维CAD解决方案。 SolidWorks 能够提供不同的设计方案、减少设计过程中的错误以及提高产品质量。SolidWorks 不仅…

Web前端大作业:基于html+css+js的仿酷狗音乐项目(内附源码)

文章目录 一、项目介绍二、项目展示三、源码展示四、获取源码 一、项目介绍 课设是要仿照酷狗音乐的首页进行设计。酷狗音乐是国内知名的音乐应用程序,凭借其优秀的音乐库和智能推荐功能吸引了大量用户群体。模仿酷狗音乐的首页设计,可以让课设展现出专业水准,体现出对优秀产品…

后端开发面经系列 -- 小鹏汽车一面面经

小鹏汽车一面面经 公众号:阿Q技术站 来源:职言详情页 (maimai.cn) 文章目录 小鹏汽车一面面经1、String类型为什么不可变?1. 安全性2. 缓存和性能优化3. 哈希码缓存4. 类设计和接口5. 简单性和可读性 2、在浏览器中输入url地址到显示主页的过…

RV32A\CSR\Counters 指令集

RV32A\CSR\Counters指令集 一、RV32A指令集1、Load-Reserved/Store-Conditional InstructionsLR.WSC.W2、Atomic Memory OperationsAMOSWAP.WAMOADD.WAMOAND.WAMOXOR.WAMOOR.W二、CSR(Control and Status Register) 指令集CSRRWCSRRSCSRRCCSRRWICSRRSICSRRCI三、"Zicntr…

两种典型的嵌入式系统架构模式

大多数嵌入式系统都具备实时特征,那么,这种嵌入式系统的典型架构可概括为两种模式,即层次化模式架构和递归模式架构。 1.层次化模式架构 为了达到概念一致性,许多系统通过层次化的方法进行搭建。这样做的结果是:位于高…

力扣752. 打开转盘锁

Problem: 752. 打开转盘锁 文章目录 题目描述思路及解法复杂度Code 题目描述 思路及解法 1.用一个集合 deads 存储所有的“死锁”状态,一个集合 visited 存储所有已经访问过的状态,以避免重复访问,一个队列 q 进行广度优先搜索(BF…

基于Python的AI动物识别技术研究

基于Python的AI动物识别技术研究 开发语言:Python 数据库:MySQL所用到的知识:Django框架工具:pycharm、Navicat、Maven 系统功能实现 系统的登录模块设计 本次设计的AI动物识别系统为了保证用户的数据安全,设计了登录的模块&…

永磁同步电机滞环电流控制(PI双闭环)matlab仿真模型

微♥“电击小子程高兴的MATLAB小屋”获取模型 1.滞环电流控制的原理 将给定的电流信号与反馈的电流信号进行比较,然后控制它俩之间的差值稳定在一个滞环范围内,若超出范围,则进行相应的调节操作。 操作如下叙述:假设以三相中的A相…

Python解析Word文档的自动编号

关于自动编号的知识可以参考《在 Open XML WordprocessingML 中使用编号列表》 链接:https://learn.microsoft.com/zh-cn/previous-versions/office/ee922775(voffice.14) python-docx库并不能直接解析出Word文档的自动编号,因为原理较为复杂&#xff…

Python第二语言(十、Python面向对象(上))

目录 1. 标记变量的基础类型 2. 初识对象 2.1 使用对象组织数据 3. 成员变量 3.1 类和类成员的定义 3.2 成员变量和成员方法使用 3.3 成员方法的定义语句 4. 类和对象class Clock: def ring(self): 4.1 创建类对象的语法:对象名 类名称() 4.2 用生活中的…