搜广推面经五

饿了么推荐算法

  • 一、介绍InfoNCE Loss、InfoNCE温度系数的作用
    InfoNCE Loss(Information Noise Contrastive Estimation Loss)是一种常用于自监督学习和对比学习中的损失函数,特别是在信息论和无监督学习中有广泛应用。
    它的核心思想是通过将正样本与负样本进行对比来学习数据的表示,目的是最大化正样本和负样本之间的区分度。InfoNCE Loss 是 Noise Contrastive Estimation(NCE)方法的一部分,而 NCE 的目标是通过优化模型使其能够区分“信号”样本和“噪声”样本。InfoNCE 的目标是使正样本的表示与给定的上下文相匹配,同时将负样本的表示与上下文分离。
    在这里插入图片描述
    伪代码实现
    假设我们有一个批量数据,其中每个样本都由一个查询向量 𝑞 和多个候选负样本向量 k i k_i ki组成
import torch
import torch.nn.functional as Fdef info_nce_loss(query, positive_key, negative_keys, temperature=0.07):"""计算InfoNCE Loss参数:query (torch.Tensor): 查询向量,大小为 (batch_size, dim)positive_key (torch.Tensor): 正样本向量,大小为 (batch_size, dim)negative_keys (torch.Tensor): 负样本向量,大小为 (batch_size, num_negatives, dim)temperature (float): 温度超参数,控制正负样本之间的区分度返回:loss (torch.Tensor): 计算得到的损失值"""# 将查询向量与正样本向量和负样本向量的内积进行计算pos_sim = torch.sum(query * positive_key, dim=-1) / temperature  # 正样本相似度neg_sim = torch.matmul(query, negative_keys.transpose(0, 1)) / temperature  # 负样本相似度# 计算正样本和负样本的相似度归一化logits = torch.cat([pos_sim.unsqueeze(1), neg_sim], dim=1)  # 将正样本和负样本拼接labels = torch.zeros(logits.size(0), dtype=torch.long).to(logits.device)  # 正样本对应的标签为 0# 使用 Softmax 进行归一化,计算 cross entropy 损失loss = F.cross_entropy(logits, labels)return loss
  • 二、介绍一下self-attention?QKV的含义及动机?
    Self-Attention(自注意力)尤其在自然语言处理(NLP)中得到了广泛的应用。自注意力机制的核心思想是:在处理输入序列中的每一个元素时,考虑序列中其他所有元素对其的影响。相比于传统的递归或卷积网络,自注意力机制可以捕捉长距离依赖关系,并且能够并行处理输入数据。
    在这里插入图片描述
    在这里插入图片描述
    简单讲就是 Q K QK QK相乘表达的是每个元素与其他元素的相似度,动态地计算出关注的重点。通过值向量 V V V的加权求和,模型能够在输出中结合不同元素的信息。
    三、力扣-268题 丢失的数字(非hot100)
    给定一个包含 [0, n] 中 n 个数的数组 nums ,找出 [0, n] 这个范围内没有出现在数组中的那个数。
    示例 1:
    输入:nums = [3,0,1]
    输出:2
    解释:n = 3,因为有 3 个数字,所以所有的数字都在范围 [0,3] 内。2 是丢失的数字,因为它没有出现在 nums 中。
class Solution:def missingNumber(self, nums: List[int]) -> int:coll_defa = collections.defaultdict(int)  # 面对数组的问题。首先可以尝试建一个字典做哈希for i in nums:coll_defa[i] = 1for j in range(len(nums)+1):if coll_defa[j] != 1:return j

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/505862.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何选择适合的证件照制作软件,让您的照片制作更轻松

在当今数字化的时代,制作证件照不再需要专门前往照相馆。选择一款合适的证件照制作软件,您可以在家中轻松完成标准证件照的拍摄与制作。然而,面对市面上琳琅满目的软件,找到最适合您需求的软件并不简单。本文将为您详细介绍选择证…

【数据库】一、数据库系统概述

文章目录 一、数据库系统概述1 基本概念2 现实世界的信息化过程3 数据库系统内部体系结构4 数据库系统外部体系结构5 数据管理方式 一、数据库系统概述 1 基本概念 数据:描述事物的符号记录 数据库(DB):长期存储在计算机内的、…

安卓硬件加速hwui

安卓硬件加速 本文基于安卓11。 从 Android 3.0 (API 级别 11) 开始,Android 2D 渲染管道支持硬件加速,这意味着在 View 的画布上执行的所有绘图操作都使用 GPU。由于启用硬件加速所需的资源增加,你的应用程序将消耗更多内存。 软件绘制&am…

第R4周:LSTM-火灾温度预测

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 文章目录 一、代码流程1、导入包,设置GPU2、导入数据3、数据集可视化4、数据集预处理5、设置X,y6、划分数据集7、构建模型8、定义训练函…

Spring 设计模式:经典设计模式

Spring 设计模式:经典设计模式 引言 Spring 框架广泛使用了经典设计模式。 这些模式在 Spring 内部发挥着重要作用。 通过理解这些设计模式在 Spring 中的应用,开发者可以更深入地掌握 Spring 框架的设计哲学和实现细节。 经典设计模式 控制反转&am…

现代企业架构白皮书(可以在线阅读完整PDF文件)

数据架构元模型综述 数据架构的内容元模型包括“结构”、“端口”两个部分,如下图所示: 结构部分用来对数据模型、数据处理建模,其中包括数据对象、数据组件 端口部分用来对数据模型的边界建模,其中包括数据服务 数据架构元模型…

krpano 实现文字热点中的三角形和竖杆

krpano 实现文字热点中的三角形和竖杆 实现文字热点中的三角形和竖杆 一个后端写前端真的是脑阔疼 一个后端写前端真的是脑阔疼 一个后端写前端真的是脑阔疼 实现文字热点中的三角形和竖杆 上图看效果 v:2549789059

Win10本地部署大语言模型ChatGLM2-6B

鸣谢《ChatGLM2-6B|开源本地化语言模型》作者PhiltreX 作者显卡为英伟达4060 安装程序 打开CMD命令行,在D盘新建目录openai.wiki if not exist D:\openai.wiki mkdir D:\openai.wiki 强制切换工作路径为D盘的openai.wiki文件夹。 cd /d D:\openai.wik…

互联网架构变迁:从 TCP/IP “呼叫” 到 NDN “内容分发” 的逐浪之旅

本文将给出关于互联网架构演进的一个不同视角。回顾一下互联网的核心理论基础产生的背景: 左边是典型的集中控制通信网络,很容易被摧毁,而右边的网络则没有单点问题,换句话说它很难被全部摧毁,与此同时,分…

priority_queue优先队列

目录 1. 最短路径算法(Dijkstra算法) 应用场景: 优先队列的作用: 2. 最小生成树算法(Prim算法) 应用场景: 优先队列的作用: 3. 哈夫曼编码(Huffman Coding&#x…

vs2022编译webrtc步骤

1、主要步骤说明 概述:基础环境必须有,比如git,Powershell这些,就不写到下面了。 1.1 安装vs2022 1、选择使用C的桌面开发 2、 Windows 10 SDK安装10.0.20348.0 3、勾选MFC及ATL这两项 4、 安装完VS2022后,必须安…

如何评价deepseek-V3 VS OpenAI o1 自然语言处理成Sql的能力

DeepSeek-V3 介绍 在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。 准备工作: 笔者只演示实例o1 VS DeepSeek-V3两个模型,大家可以自行验证结果或者实验更多场景,同时…

9.4 visualStudio 2022 配置 cuda 和 torch (c++)

一、配置torch 1.Libtorch下载 该内容看了【Libtorch 一】libtorchwin10环境配置_vsixtorch-CSDN博客的博客,作为笔记用。我自己搭建后可以正常运行。 下载地址为windows系统下各种LibTorch下载地址_libtorch 百度云-CSDN博客 下载解压后的目录为: 2.vs…

Mysql--基础篇--多表查询(JOIN,笛卡尔积)

在MySQL中,多表查询(也称为联表查询或JOIN操作)是数据库操作中非常常见的需求。通过多表查询,你可以从多个表中获取相关数据,并根据一定的条件将它们组合在一起。MySQL支持多种类型的JOIN操作,每种JOIN都有…

gesp(C++四级)(11)洛谷:B4005:[GESP202406 四级] 黑白方块

gesp(C四级)(11)洛谷:B4005:[GESP202406 四级] 黑白方块 题目描述 小杨有一个 n n n 行 m m m 列的网格图,其中每个格子要么是白色,要么是黑色。对于网格图中的一个子矩形,小杨认为它是平衡的…

易于上手难于精通---关于游戏性的一点思考

1、小鸟、狙击、一闪,都是通过精准时机来逼迫玩家练习, 而弹道、出招时机等玩意,不是那么容易掌握的,需要反复的观察、反应与行动, 这也正是游戏性的体现, 玩家能感觉到一些朦胧的东西,但又不…

微信小程序——创建滑动颜色条

在微信小程序中,你可以使用 slider 组件来创建一个颜色滑动条。以下是一个简单的示例,展示了如何实现一个颜色滑动条,该滑动条会根据滑动位置改变背景颜色。 步骤一:创建小程序项目 首先,使用微信开发者工具创建一个新…

JVM实战—12.OOM的定位和解决

大纲 1.如何对系统的OOM异常进行监控和报警 2.如何在JVM内存溢出时自动dump内存快照 3.Metaspace区域内存溢出时应如何解决(OutOfMemoryError: Metaspace) 4.JVM栈内存溢出时应如何解决(StackOverflowError) 5.JVM堆内存溢出时应该如何解决(OutOfMemoryError: Java heap s…

Unity自定义编辑器:基于枚举类型动态显示属性

1.参考链接 2.应用 target并设置多选编辑 添加[CanEditMultipleObjects] using System.Collections; using System.Collections.Generic; using UnityEngine; using UnityEditor;[CustomEditor(typeof(LightsState))] [CanEditMultipleObjects] public class TestInspector :…

Qt重写webrtc的demo peerconnection

整个demo为: 可以选择多个编码方式: cmake_minimum_required(VERSION 3.5)project(untitled LANGUAGES CXX) set(CMAKE_CXX_STANDARD 20) set(CMAKE_INCLUDE_CURRENT_DIR ON)set(CMAKE_AUTOUIC ON) set(CMAKE_AUTOMOC ON) set(CMAKE_AUTORCC ON)set(CMA…