论文笔记-WSDM2024-LLMRec

论文笔记-WSDM2024-LLMRec: Large Language Models with Graph Augmentation for Recommendation

  • LLMRec: 基于图增强的大模型推荐
  • 摘要
  • 1.引言
  • 2.前言
    • 2.1使用图嵌入推荐
    • 2.2使用辅助信息推荐
    • 2.3使用数据增强推荐
  • 3.方法
    • 3.1LLM作为隐式反馈增强器
    • 3.2基于LLM的辅助信息增强
      • 3.2.1用户画像与项目属性增强
      • 3.2.2辅助信息融合
    • 3.3使用去噪稳健机制训练
      • 3.3.1带噪声剪枝的增强优化
      • 3.3.2通过MAE增强语义特征
  • 4.实验
    • 4.1实验设置
    • 4.2模型性能
    • 4.3消融实验
    • 4.4超参数实验
  • 5.总结

LLMRec: 基于图增强的大模型推荐

论文: LLMRec: Large Language Models with Graph Augmentation for Recommendation
代码: LLMRec

摘要

以往的研究通过引入辅助信息来解决数据稀疏问题,但这种方法常常引发噪声、可用性差和低数据质量等问题,从而影响用户偏好的准确建模。

本文提出了一个名为LLMRec的新框架,基于LLM图增强策略提升推荐系统。LLMRec通过三种方式增强交互图:(i) 强化用户-项目交互边,(ii) 加深对项目节点属性的理解,以及 (iii) 从自然语言角度生成用户画像。此外,为确保增强数据的质量,本文还开发了一种去噪数据稳健化机制,包括噪声隐式反馈剪枝和基于MAE的特征增强技术,以优化增强数据并提高其可靠性。

1.引言

辅助信息的数据质量问题包括:i) 数据噪声:属性或特征可能与用户偏好缺乏直接相关性。ii) 数据异质性:每种信息都有独特的特征、结构和表示,忽略这种异质性会导致分布失衡。iii) 数据不完整性:项目可能有不完整的文本描述或缺少关键的属性。

本文旨在通过显式增强潜在用户-项目交互边以及改进用户/项目节点的辅助信息来克服这些挑战。首先,LLMRec利用LLMs从自然语言的角度预测用户-项目交互。与间接的ID嵌入相比,自然语言表示更直观地反映了用户偏好。其次,LLMs在大量现实世界知识上进行训练,可以理解用户偏好并提供有价值的补充信息。另外,LLMs的综合词库将嵌入统一到一个向量空间中,缩小了异质特征之间的差距,促进了编码器的计算。这样的整合防止了特征在不同向量空间中的分散,从而提供了更准确的结果。

其主要贡献可以概述如下:

  • LLMRec 是一项开创性工作,利用LLMs进行图增强,包括:i) 用户-项目交互边,ii) 项目节点属性,iii) 用户节点画像。

  • 所提出的 LLMRec 通过使 LLM 能够明确推理用户-项目交互模式,解决了隐式反馈信号稀缺的问题。

  • 通过用户/项目属性生成和去噪增强稳健机制(结合噪声反馈修剪和基于 MAE 的特征增强)解决了低质量辅助信息的问题。

2.前言

2.1使用图嵌入推荐

CF通过稀疏的隐式反馈 E + E^+ E+ 学习,旨在获取协同用户-物品对应的嵌入 E u ​ E_u​ Eu E i ​ E_i​ Ei,以进行推荐。部分推荐系统采用图神经网络(GNNs)来建模复杂的高阶用户-物品关系,将 E + E^+ E+ 视为稀疏交互图的边。因此,CF 过程可以分为两个阶段:二分图嵌入和用户-物品预测。优化协同图嵌入 E = { E u , E i } E = \{ E_u, E_i \} E={Eu,Ei} 的目标是最大化后验估计,形式化表示如下:
在这里插入图片描述
其中, p ( E ∣ E + ) p(E|E^+) p(EE+) 的目标是尽可能多地将 E + E^+ E+ 中的用户-物品关系编码到 E u ​ E_u​ Eu E i ​ E_i​ Ei 中,以实现准确的用户-物品预测。

2.2使用辅助信息推荐

为了解决数据稀疏性问题,许多研究引入了形式为节点特征 F F F 的辅助信息,将推荐器编码器 f Θ ​ f_\Theta​ fΘ 视为特征图。带有辅助信息 F F F f Θ f_\Theta fΘ 的学习过程被表述为最大化后验估计 p ( Θ ∣ F , E + ) p(\Theta|F, E^+) p(Θ∣F,E+)
在这里插入图片描述

2.3使用数据增强推荐

尽管将辅助信息引入推荐系统取得了显著进展,但低质量的辅助信息可能会削弱稀疏交互数据 E + E^+ E+ 的有效性。LLMRec 专注于用户-物品交互特征图的增强,这涉及到 LLM 增强的用户-物品交互边 E A ​ E_A​ EA 和 LLM 生成的节点特征 F A ​ F_A​ FA。增强交互特征图的优化目标为:
在这里插入图片描述

3.方法

LLMRec的框架如图1所示。
在这里插入图片描述

3.1LLM作为隐式反馈增强器

采用LLM作为知识感知采样器,从自然语言的角度对用户-物品(u-i)训练数据进行成对采样。具体而言,将每个用户的历史交互物品与辅助信息(如年份、类型)以及物品候选池 C u C_u Cu 输入到 LLM 中。然后,LLM从 C u ​ C_u​ Cu 中选择用户 u u u 可能交互的物品( i u + i^+_u iu+)或不太可能交互的物品( i u − i^-_u iu)。增强用户-物品交互边并将其纳入训练数据的过程可以形式化为:
在这里插入图片描述
其中, i u + , i u − ​ i^+_u, i^-_u​ iu+,iu 是 LLM 基于输入提示 P u U I ​​ P^{UI}_u​​ PuUI​​从候选集 C u ​ C_u​ Cu 中为用户 u u u 选择的 BPR 正负样本,增强数据集 E A ​ E_A​ EA 包含成对训练三元组 ( u , i u + , i u − ) (u, i^+_u, i^-_u) (u,iu+,iu)。文本的 u-i 增强提示 P u U I ​​ P^{UI}_u​​ PuUI​​ 包含不同的组成部分:i) 任务描述,ii) 历史交互,iii) 候选物品,以及 iv) 输出格式描述,如图 2(a) 所示。
在这里插入图片描述

3.2基于LLM的辅助信息增强

3.2.1用户画像与项目属性增强

LLM 基于辅助信息增强范式包括两个步骤:

  1. 用户/物品信息精炼。通过使用从数据集的交互和辅助信息中衍生的提示,使 LLM 生成不在数据集中的用户和物品属性。具体示例见图 2(b)©。

  2. LLM 增强的语义嵌入。增强后的用户和物品信息将被编码为特征,并作为推荐系统的输入。使用 LLM 作为编码器提供了高效且先进的语言理解能力,使得用户交互偏好画像化并消除物品属性的偏见。

形式上,基于 LLM 的辅助信息增强如下:
在这里插入图片描述
其中 f A , u , f A , i ∈ R d L L M ​ f_{A,u}, f_{A,i} \in \mathbb{R}^{d_{LLM}}​ fA,u,fA,iRdLLM 是经过 LLM 增强的用户/物品特征,具有 LLM 的隐藏维度 d L L M d_{LLM} dLLM。文本提示 P u U ​​ P^U_u​​ PuU​​ P i I ​​ P^I_i​​ PiI​​ 分别用于用户 u u u 和物品 i i i 的属性精炼。 A u ​ A_u​ Au A i ​ A_i​ Ai 表示生成的文本属性,这些属性将通过 LLM 的嵌入能力编码为特征 F A , u , F A , i ​ F_{A,u}, F_{A,i}​ FA,u,FA,i

3.2.2辅助信息融合

在获得用户/物品的增强辅助信息后,采用以下三个步骤融合信息:

  1. 增强语义投影。使用带 dropout 的线性层,不仅减少 LLM 增强的语义特征的维度,还将这些增强特征映射到它们自己的空间。

  2. 协同上下文注入。为了将高阶协同连接注入到增强特征中,LLMRec 使用轻量级的图神经网络作为编码器。

  3. 语义特征融合。将增强特征 F A ​ F_A​ FA 视为附加组成部分,而不是作为推荐系统的可学习向量的初始化。这允许使用缩放因子和归一化灵活调整 LLM 增强特征的影响。

形式上, F A ​ F_A​ FA 的融合表示为:
在这里插入图片描述
最终的预测表示 h u ​ h_u​ hu h i ​ h_i​ hi 位于 R 1 × d \mathbb{R}^{1 \times d} R1×d。用户画像为 A u ​ A_u​ Au,去偏见的物品属性为 A i ​ A_i​ Ai,原始的多模态辅助信息为 M M M。特征的具体类型为 f k ​ f_k​ fk。使用聚合权重 ω 1 ​ \omega_1​ ω1 L 2 ​ L_2​ L2 归一化来调整特征向量,以减轻分布差异,确保额外特征在推荐编码器中的有效性。

3.3使用去噪稳健机制训练

3.3.1带噪声剪枝的增强优化

本文使用并集 E ∪ E A ​ E \cup E_A​ EEA 训练推荐系统,通过增加监督信号来优化 BPR 损失,利用整合的 LLM 增强用户偏好来提升推荐系统的性能:
在这里插入图片描述
其中,正负样本对的预测分数通过最终表示 h h h 的内积获得,样本数量 ∣ E A ∣ |E_A| EA 由批量大小 B B B 和比率 ω 3 ​ \omega_3​ ω3 控制。权重衰减正则化 ∥ Θ ∥ 2 \|\Theta\|^2 ∥Θ2 ω 2 ​ \omega_2​ ω2 加权,以减轻过拟合。 σ ( ⋅ ) \sigma(\cdot) σ() 是激活函数 sigmoid,用于引入非线性。

为了增强增强数据的有效性,本文选择剔除不可靠的用户-项目交互噪声。具体来说,在每次迭代后,排序后丢弃最大的负值。这有助于优先考虑和强调相关的监督信号,同时减轻噪声的影响。形式上,带有噪声修剪的目标 L B P R ​ L_{BPR}​ LBPR 可以重写为:
在这里插入图片描述
其中,函数 SortAscend ( ⋅ ) [ 0 : N ] \text{SortAscend}(\cdot)[0:N] SortAscend()[0:N] 对值进行排序并选择前 N N N 个。保留的数量 N N N N = ( 1 − ω 4 ) ⋅ ∣ E ∪ E A ∣ N = (1 - \omega_4) \cdot |E \cup E_A| N=(1ω4)EEA 计算,其中 ω 4 ​ \omega_4​ ω4 是一个比率。该方法允许对损失样本进行控制性修剪,强调相关信号,同时减少噪声。这可以避免不可靠的梯度反向传播的影响,从而使优化过程更加稳定和有效。

3.3.2通过MAE增强语义特征

为了减轻噪声增强特征的影响,采用掩码自编码器MAE进行特征增强。形式上,选择一个节点子集 e ⊂ V e \subset V eV 并使用掩码标记 [MASK] 来掩盖它们的特征,表示为 f [ MASK ] f[\text{MASK}] f[MASK]。掩码操作可以表示为:
在这里插入图片描述
为了增强特征编码器,引入特征恢复损失 L F R ​ L_{FR}​ LFR,通过比较掩码属性矩阵与原始增强特征矩阵来实现,带有一个缩放因子 γ \gamma γ。恢复损失函数 L F R ​ L_{FR}​ LFR 定义为:
在这里插入图片描述
最终的优化目标是噪声修剪的 BPR 损失 L B P R ​ L_{BPR}​ LBPR 和特征恢复损失 L F R ​ L_{FR}​ LFR 的加权和。

4.实验

4.1实验设置

数据集:ML-10M和Netflix

基线:

  1. 一般CF方法:MFBPR,NGCF和LightGCN

  2. 带有辅助信息的方法:VBPR,MMGCN和GRCN

  3. 数据增强方法:LATTICE

  4. 自监督方法:CLCRec,MMSSL和MICRO

4.2模型性能

在这里插入图片描述
结论:

  1. LLMRec整体性能优越:LLMRec通过明确增强用户-物品交互边和提高辅助信息的质量,超越了基线模型。

  2. 辅助信息的有效性:辅助信息的整合显著增强了推荐系统的能力,MMSSL和MICRO的性能优于NGCF。

  3. 不准确的增强对模型的改进有限:LATTICE和MICRO,也利用辅助信息进行数据增强,但与LLMRec相比,改进有限。

  4. 相对于自监督学习方法的优势:MMSSL和MICRO的自监督模型在通过自监督信号解决稀疏性方面表现优异,然而并未超越LLMRec。

4.3消融实验

在这里插入图片描述
结论:

  1. w/o-u-i:禁用 LLM 增强的隐式反馈 E A ​ E_A​ EA 导致性能显著下降。这表明,LLMRec通过包含上下文知识增加了潜在的监督信号,从而更好地把握用户偏好。

  2. w/o-u:去除用户画像增强器导致性能下降,这表明增强的用户信息能够有效地利用历史交互和物品端知识来总结有用的用户偏好画像。

  3. w/o-u&i:去除用户和物品的增强辅助信息时,推荐准确性下降。这一发现表明,基于LLM的增强信息为推荐系统提供了有价值的增强数据,帮助获得高质量和信息丰富的表示。

  4. w/o-prune:去除噪声修剪导致性能下降。这表明去除噪声隐式反馈信号的过程有助于防止不正确的梯度下降。

  5. w/o-QC:当同时去除对隐式反馈和语义特征质量的限制时,性能受到影响。这表明,通过整合噪声修剪和语义特征增强,去噪数据鲁棒性机制带来了显著的好处。

4.4超参数实验

在这里插入图片描述
结论:

  1. 温度系数 τ \tau τ:温度系数 τ \tau τ 影响文本的随机性。较高的值(>1.0)增加多样性和创造性,而较低的值(<0.1)则导致更集中。如表 4 所示,增加 τ \tau τ 最初改善了大多数指标,但随后出现下降。

  2. Top-p 值 p p p:Top-p 采样根据由 top-p 参数 p p p 决定的阈值选择标记。较低的 p p p 值优先考虑可能的标记,而较高的值则鼓励多样性。较小的 p p p 值往往能产生更好的结果,可能是因为避免了未列出的候选选择。较高的 p p p 值则会因重复的 LLM 推理导致标记浪费。

  3. 候选项数量 C C C:使用 C C C 来限制基于 LLM 的推荐的物品候选项。表 5 显示 C = 10 C = 10 C=10 产生了最佳结果。较小的值限制了选择,而较大的值则增加了推荐的难度。

5.总结

本研究旨在设计增强LLM的模型,以应对稀疏的隐式反馈信号和低质量辅助信息的挑战,通过分析用户互动偏好和去偏见商品属性来实现。为了确保增强数据的质量,引入了一种去噪增强鲁棒性机制。LLMRec 的有效性得到了理论分析和实验结果的支持,展示了其在基准数据集上优于最先进推荐技术的优势。未来的研究方向包括将因果推理整合到侧信息去偏见中,以及探索上下文感知用户偏好的反事实因素。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22058.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

优化YOLOv8:如何利用ODConv卷积解决复杂背景下的目标识别问题

文章目录 1. YOLOv8的现状与挑战1.1 ODConv的提出背景1.2 ODConv卷积的原理 2. YOLOv8与ODConv的结合2.1 ODConv集成到YOLOv8中的架构2.2 代码实现示例2.3 性能评估与改进 3. ODConv的实际应用与优化3.1 ODConv在不同数据集上的表现3.1.1 COCO数据集3.1.2 VOC数据集3.1.3 自定义…

DPVS-2:单臂负载均衡测试

上一篇编译安装了DPVS&#xff0c;这一篇开启DPVS的负载均衡测试 &#xff1a; 单臂 FULL NAT模式 拓扑-单臂 单臂模式 DPVS 单独物理机 CLINET&#xff0c;和两个RS都是另一个物理机的虚拟机&#xff0c;它们网卡都绑定在一个桥上br0 &#xff0c; 二层互通。 启动DPVS …

Maven导入hutool依赖报错-java: 无法访问cn.hutool.core.io.IORuntimeException 解决办法

欢迎大家来到我的博客~欢迎大家对我的博客提出指导&#xff0c;有错误的地方会改进的哦~点击这里了解更多内容 目录 一、报错二、解决办法 一、报错 <dependency><groupId>cn.hutool</groupId><artifactId>hutool-captcha</artifactId> </de…

flowable适配达梦数据库

文章目录 适配相关问题无法从数据库产品名称“DM DBMS”中推断数据库类型分析解决 构建ibatis SqlSessionFactory时出错&#xff1a;inStream参数为null分析解决 liquibase相关问题问题一&#xff1a;不支持的数据库 Error executing SQL call current_schema: 无法解析的成员访…

ElasticSearch公共方法封装

业务场景 1、RestClientBuilder初始化&#xff08;同时支持单机与集群&#xff09; 2、发送ES查询请求公共方法封装&#xff08;支持sql、kql、代理访问、集群访问、鉴权支持&#xff09; 3、判断ES索引是否存在&#xff08;/_cat/indices/${indexName}&#xff09; 4、判断ES…

题海拾贝:【枚举】P2010 [NOIP 2016 普及组] 回文日期

Hello大家好&#xff01;很高兴我们又见面啦&#xff01;给生活添点passion&#xff0c;开始今天的编程之路&#xff01; 我的博客&#xff1a;<但凡. 我的专栏&#xff1a;《编程之路》、《数据结构与算法之美》、《题海拾贝》 欢迎点赞&#xff0c;关注&#xff01; 1、题…

《深入理解JVM》实战笔记(二): 类加载机制与类加载器

序言 Java 语言的强大之处之一在于其动态加载的能力&#xff0c;使得 Java 程序可以在运行时加载新的类&#xff0c;而不需要在编译时确定所有的类信息。这一切都离不开 JVM 的类加载机制。本篇博客将详细探讨 JVM 的类加载过程以及类加载器的工作原理&#xff0c;帮助你更深入…

vin码拍照识别-车牌识别api-vin码接口解析

在当今数字化飞速发展的背景下&#xff0c;如何高效、准确地管理和追踪车辆信息成为了众多企业和个人关注的焦点。VIN码&#xff08;Vehicle Identification Number&#xff09;和车牌作为车辆独一无二的身份标识&#xff0c;在车辆管理、保险理赔、二手车交易等多个场景中发挥…

Tomcat理论(Ⅰ)

目录 服务器流程图一览 一、JavaWeb前奏(了解) 1. C/S结构 2. B/S结构 3. 静态网页&动态网页 4.常见的网页 5.Web服务器 知名服务器&#xff1a; ​编辑 二、Tomcat安装&#xff08;熟练&#xff09; 1.Tomcat概述 2.Tomcat的作用 3.Tomcat安装 4.Tomcat测试 3.…

[实现Rpc] 通信-Muduo库的实现 | 完美转发 | reserve | unique_lock

目录 MudouBuffer ⭕右值引用 | 完美转发 右值引用 完美转发 实现原理 结合右值引用和完美转发的例子 LVProtocol ⭕vector 的 reserve 函数 1. 背景 2. reserve 函数原型 3. 示例代码 4. 输出结果 5. 结果解析 6. 关键点说明 MuduoConnection ⭕mudou 库 &am…

[OD E 100] 生成哈夫曼树

题目 题目描述 给定长度为 n 的无序的数字数组&#xff0c;每个数字代表二叉树的叶子节点的权值&#xff0c;数字数组的值均大于等于 1 。请完成一个函数&#xff0c;根据输入的数字数组&#xff0c;生成哈夫曼树&#xff0c;并将哈夫曼树按照中序遍历输出。 为了保证输出的二…

网络安全知识:网络安全概念、内容和主要技术纵览

21世纪全世界的计算机都将通过Internet联到一起&#xff0c;随着Internet的发展&#xff0c;网络丰富的信息资源给用户带来了极大的方便&#xff0c;但同时也给上网用户带来了安全问题。由于Internet的开放性和超越组织与国界等特点&#xff0c;使它在安全性上存在一些隐患。而…

【机器学习】多元线性回归算法和正规方程解求解

多元线性方差和正规方差解 一、摘要二、多元线性回归介绍三、正规方程解的求解及代码实现 一、摘要 本文围绕多元线性回归的正规方程解展开&#xff0c;为初学者系统介绍了相关基本概念、求解方法、实际应用以及算法封装要点。 首先&#xff0c;深入阐释了正规方程解这一多元…

Arcmap和ArcgisPro重装及配置迁移

近期要重装一下ArcgisPro&#xff0c;在此记录并作为大家的借鉴 1.备份配置文件&#xff1a;其中Desktop10.8为Arcmap的配置文件 2.通过控制面板卸载&#xff0c;arcpro卸载时间较长&#xff0c;先将语言包等卸载&#xff0c;最后再卸载5G主程序&#xff0c;有些文章会介绍清理…

【天线】IFA天线知识点摘抄

MIFA天线的尺寸与性能关系 1&#xff0c;辐射效率 天线越小&#xff0c;辐射效率越低。唯一好处是减少PCB占用空间 2&#xff0c;带宽 一般MIFA天线在2.4G频段内的带宽&#xff1a;S11≤-10dB的范围为2.44GHz230MHz。较小的尺寸可能会限制带宽 3&#xff0c;增益 MIFA天线的…

路由基本配置

学习目标 • 根据拓扑图进行网络布线。 • 清除启动配置并将路由器重新加载为默认状态。 • 在路由器上执行基本配置任务。 • 配置并激活以太网接口。 • 测试并检验配置。 • 思考网络实施方案并整理成文档。 任务 1&#xff1a;网络布线 使用适当的电缆类型连接网络设备。…

力扣27. 移除元素(快慢指针)

Problem: 27. 移除元素 文章目录 题目描述思路Code 题目描述 思路 定义快慢指针均指向数组起始位置&#xff0c;当fast指针指向的元素不等于val时将fast指针指向的元素赋值给slow并让slow指针向前移动&#xff0c;fast指针一直向前移动 时间复杂度: O ( n ) O(n) O(n); 空间复杂…

jemalloc 5.3.0里的快速路径分配逻辑及可借鉴的高性能编程思路

一、背景 jemalloc 5.3.0的介绍&#xff0c;我们已经持续了一段时间了&#xff0c;在 jemalloc 5.3.0的tsd模块的源码分析-CSDN博客 博客里&#xff0c;我们介绍了jemalloc的编译和调试&#xff0c;在 跟踪jemalloc 5.3.0的第一次malloc的源头原因及jemalloc相关初始化细节拓展…

Vue前端开发-Vant之Layout组件

在Vant 中&#xff0c;Layout组件用于元素的响应式布局&#xff0c;分别由van-row和van-col两个组件来实现&#xff0c;前者表示行&#xff0c;后者被包裹在van-row组件中&#xff0c;表示列&#xff0c;共有24列栅格组成&#xff0c;在van-col组件中&#xff0c;span属性表示所…

【UCB CS 61B SP24】Lecture 5 - Lists 3: DLLists and Arrays学习笔记

本文内容为构建双向循环链表、使用 Java 的泛型将其优化为通用类型的链表以及数组的基本语法介绍。 1. 双向链表 回顾上一节课写的代码&#xff0c;当执行 addLast() 与 getLast() 方法时需要遍历链表&#xff0c;效率不高&#xff0c;因此可以添加一个指向链表末尾的索引&am…