WSDM24-因果推荐|因果去偏的可解释推荐系统

 

1 动机

可解释推荐系统(ERS)通过提供透明的推荐解释,提高用户信任度和系统的说服力,如下图所示,然而:

1:现有工作主要关注推荐算法的去偏(流行度偏差),但未显式建模模型生成的解释如何影响推荐结果(解释偏差),导致推荐系统仍可能在解释层面继承流行度偏差,使得推荐解释偏向热门物品的共性特征,放大推荐系统中的偏差,而非用户的真实兴趣。

2:忽略了模型生成的解释本身可能存在的偏差,例如,热门物品往往具有更丰富的用户交互数据,因此其解释更容易被模型学到,而冷门物品的解释则可能受限,导致推荐系统的解释不够个性化,甚至进一步放大推荐结果的偏差。


2 贡献

从因果推理的视角,提出了一种因果可解释推荐系统(Causal Explainable Recommendation System, CERS)

1:提出了基于因果推理的可解释推荐系统框架,通过因果图建模用户-物品交互与推荐解释之间的关系,明确解释变量在推荐过程中的影响,揭示推荐系统中的解释偏差来源。

2:引入因果干预消除解释偏差,采用前门调整,利用模型生成的解释作为中介变量,有效去除推荐和解释中的流行度偏差,使推荐更加个性化。

3:结合用户反馈优化推荐与解释,CERS设计了一种交互机制,允许用户对推荐解释进行点击反馈,使得系统能够自适应地调整推荐逻辑,提高推荐结果的个性化程度和用户满意度。


3 问题定义

结合了可解释推荐系统的特点,引入模型生成的解释作为中介变量,为后续的前门调整提供基础。

这段就不说了,用户项目集合以及交互:

 

预测函数用于估计用户对物品的偏好,然而在可解释推荐系统(ERS)中,不仅要生成推荐,还要提供解释:首先是候选解释集合 ,包含所有可能的解释维度(例如电影推荐系统中的“剧情”“演员”等)以及解释向量 ,表示推荐物品 i 时,生成的解释概率分布。

ERS流程:1 基于用户和物品计算匹配表示m;2基于m使用解释生成模型生成解释;3基于 m和解释计算最终推荐分数


 4 因果图

CERS目的是同时去除推荐结果和和生成解释的偏差: 

 

U:用户特征;I:物品特征;M:用户-物品匹配嵌入;E:模型生成的解释;Y:推荐分数

传统推荐系统的因果关系表示为图 2a,目标是学习用户和物品的匹配函数,通过 M计算最终推荐分数 Y,  但由于历史数据中热门物品更容易被曝光和交互,导致 M 存在偏差,从而影响最终的推荐结果 Y。

在可解释推荐系统中,模型生成的解释E起到了中介变量的作用,解释 E 由匹配嵌入 M 生成,并影响最终的推荐结果 Y。如果E存在解释偏差,会进一步放大推荐系统的流行度偏差。因此使用因果干预的前门调整来减少 E的偏差。

前门调整

通过将解释 E作为中介变量,避免推荐系统直接受到匹配嵌入 M的流行度偏差影响。前门调整通过分解路径 M→E→Y来去除偏差。根据因果推理中的前门调整定理,通过公式计算因果效应:

 P(Y∣do(M)):表示在去除了偏差后,M 对 Y 的真实因果效应;​P(E∣M):解释 E 由匹配嵌入 M生成的概率;P(Y∣M′,E)P(M′):通过解释 E 来计算调整后的推荐分数(通过调整 M的分布,使得 M 的影响仅通过 E传播到 Y,避免直接受流行度偏差的影响。)


5 CERS

流程:首先从历史数据中提取用户和项目嵌入。 同时,从用户评论中获得候选解释集(E)。 这些预处理方法在整个数据提取过程中保持一致。 给定𝑢和item,通过基于神经网络的表示提取模块(如多层感知器(MLP)生成M。 解释生成模型处理用户-项目匹配并产生一个表示解释可能性的向量(Eu)。 最后,项目排名模块使用多层感知器算法计算用户项目对的分数。

5.1 匹配嵌入M计算

​首先计算用户 u和物品 i之间的匹配嵌入 mui,通过基于神经网络的表示提取模块。

5.2 生成解释嵌入

首先生成候选集,并利用神经网络计算每个候选item与用户和物品的匹配表示M的得分,并生成

5.3前门调整

eui,j​ 表示用户 u对物品 i的解释向量中第 j个解释项的概率;y(m′,eui,j​) 表示在解释 影响下,用户 u对物品 i进行的交互评分;M′ 是用户-物品匹配集合的一个随机子集。首先计算用户-物品匹配 m′及其对应的推荐评分,其次计算该推荐评分在所有可能的解释下的均值,从而去除模型生成解释的偏差。

5.4 用户模拟器

CERS 希望优化推荐结果和生成的解释,但是现实世界的数据集很少包含显式用户反馈关于模型生成的解释。大多数数据集只有用户点击某个物品的记录,但没有用户是否认可推荐解释的记录。因此使用用户模拟器提供了一种方法,可以自动生成用户的模拟反馈,以评估解释质量并提供监督信号,训练解释生成模型。

首先基于用户的历史交互,通过短语级情感分析提取属性特征向量(剧情质量,视觉效果),表示表示物品 i在某个解释 j上的评分,如果用户过去的交互记录中某个解释的评分较高,则用户更有可能接受该解释。

t 是用户交互过的物品数量,δ 是预设的阈值。如果用户历史交互的物品在某个解释维度 j上的平均得分超过 δ,那么用户更可能接受该解释,并生成模拟点击反馈,从而提供监督信号,用于计算解释损失

推荐分数衡量用户是否点击了推荐物品,解释损失衡量推荐解释的质量


6 实验分析

6.1 评价指标

为了评估推荐的准确性,论文使用了NDCG衡量推荐列表的排名质量;

为了衡量推荐系统去偏差的能力,使用了以下两个去偏指标:

Concentration Ratio (C-Ratio)集中度比率,用于衡量推荐系统是否存在马太效应,即是否过度偏向热门物品。

Pu​ 表示用户u的前 K 个推荐物品集合,Ihot​ 表示数据集中最流行的前 15% 物品集合,较低的 C-Ratio说明模型减少了对热门物品的依赖,推荐更加多样化。

Average Recommendation Popularity(ARP)平均推荐流行度,衡量模型在推荐时偏向流行物品的程度。

 ϕ(i) 表示物品在数据集中被交互的次数,Pu​ 表示用户u的前 K 个推荐物品集合,较低的 ARP说明模型更倾向于推荐长尾物品,提升推荐的公平性和多样性。

6.2 去偏能力

为了评估去偏差能力,首先根据项目受欢迎程度分为七组进行了实验分析。

此外,通过对不同受欢迎程度的项目进行不同的评估,评估缓解流行度偏差的能力。 将数据集分为“热门项目”(推荐频率前15%)和“长尾”项目。


 7 总结

前门调整的实现:1 基于匹配嵌入M生成候选解释 E;2 用户模拟器提供解释反馈 eui;3通过前门调整计算去偏推荐分数。而用户模拟器解释E真实反映用户兴趣,而非流行度偏差,前门调整通过用户模拟器提供的解释反馈来去偏。​

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25673.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深度解析 ANSI X9.31 TR-31:金融行业密钥管理核心标准20250228

深度解析 ANSI X9.31 TR-31:金融行业密钥管理核心标准 在当今数字化金融时代,信息安全至关重要,而密钥管理则是保障金融数据安全的核心环节。ANSI X9.31 TR-31作为金融行业密钥管理的关键标准,为对称密钥的全生命周期管理提供了坚…

Coredns延迟NodeLocalDNS解决之道

#作者:邓伟 文章目录 问题列表问题分析:问题分析解决方案详情方案验证部署步骤验证结论回滚方案回滚验证注意事项NodeLocalDNS介绍 问题列表 近来发现K8s频繁出现5s超时问题,业务反馈收到一定影响,问题包括: coredn…

Apollo Cyber 学习笔记

目录 0 Introduction What Why Advantage 1 Example 2 Concept 3 Flow Chart 4 Module 4.1 Transport 4.1.1 Share Memory 4.1.1.1 Segment 4.1.1.1.1 State 4.1.1.1.2 Block 4.1.1.1.3 Common 4.1.1.2 Notifier 4.1.1.2.1 ConditionNotifier 4.1.1.2.2 Multi…

正浩创新内推:校招、社招EcoFlow社招内推码: FRQU1CY

EcoFlow社招内推码: FRQU1CY 投递链接: https://ecoflow.jobs.feishu.cn/s/Vo75bmlNr6c

FreeRTOS-中断管理

实验目的 创建一个队列及一个任务,按下按键 KEY1 触发中断,在中断服务函数里向队列里发送数据,任务则阻塞接 收队列数据。 实验代码 实验结果 这样就实现了,使用中断往队列的发送信息,用任务阻塞接收信息

【通俗讲解电子电路】——从零开始理解生活中的科技(一)

导言:电子电路为什么重要? ——看不见的“魔法”,如何驱动你的生活? 清晨,当你的手机闹钟响起时,你可能不会想到,是电子电路在精准控制着时间的跳动;当你用微波炉加热早餐时&#…

无人机与AI!

一、技术革新:AI赋能无人机智能化 自主导航与避障 AI通过深度学习与计算机视觉技术,使无人机能够在复杂环境中实时分析飞行路径、预测障碍物并自主调整路线。例如,微分智飞推出的P300无人机可在无GPS信号的环境下完成自主导航,利…

基因型—环境两向表数据分析——品种生态区划分

参考资料:农作物品种试验数据管理与分析 用于品种生态区划分的GGE双标图有两种功能图:试点向量功能图和“谁赢在哪里”功能图。双标图的具体模型基于SD定标和h加权和试点中心化的数据。本例中籽粒产量的GGE双标图仅解释了G和GE总变异的53.6%,…

【江科大STM32】TIM输出比较(学习笔记)

本章图片文字内容也为重要知识,请马住! 输出比较简介 OC(Output Compare)输出比较输出比较可以通过比较CNT与CCR寄存器值的关系,来对输出电平进行置1、置0或翻转的操作,用于输出一定频率和占空比的PWM波形…

在Linux上安装MySQL

1.下载Linux版MySQL安装包 https://downloads.mysql.com/archives/community/ 2. 上传MySQL安装包 (FinalShell示例) 3. 创建目录,并解压 mkdir mysqltar -xvf mysql-8.0.26-1.el7.x86_64.rpm-bundle.tar -C mysql4. 安装mysql的安装包 cd mysqlr…

MyBatis的关联映射

前言 在实际开发中,对数据库的操作通常会涉及多张表,MyBatis提供了关联映射,这些关联映射可以很好地处理表与表,对象与对象之间的的关联关系。 一对一查询 步骤: 先确定表的一对一关系确定好实体类,添加关…

智能AI替代专家系统(ES)、决策支持系统(DSS)?

文章目录 前言一、专家系统(ES)是什么?二、决策支持系统(DSS)是什么?1.决策支持系统定义2.决策系统的功能与特点3.决策支持系统的组成 三、专家系统(ES)与决策支持系统(D…

C++学习之函数、指针、字符串

一.函数; 1.函数的定义和调用 2.函数的声明 3.函数的分类 4.函数的值传递 5.函数的分文件编写 //#define _CRT_SECURE_NO_WARNINGS //#include<stdio.h> //#include<string.h> //#include<stdlib.h> //#include "test.h" // // //int main() //{ …

C#-委托

Action 无返回值&#xff0c;多线程常用 Action<string> action1 (name) > Console.WriteLine($"hello {name}"); action1("tom"); Func 有返回值&#xff0c;扩展方法常用&#xff0c;最后一个参数是输出参数 Func<int, int, double>…

场景重建——Nerf场景重建

3DGS和Nerf的区别 一、概念二、3DGS区别三、相关工作三、Nerf相关工作3.1、Point-NeRF&#xff08;CVPR2022:Point-Based Neural Radiance Fileds&#xff09;3.2、Plenoxels(CVPR2022:Radiance Fields without Neural Networks)3.3、MARS: An Instance-aware, Modular and Rea…

java jar包内的jar包如何打补丁

问题描述&#xff1a; 主包&#xff1a;hisca.jar&#xff0c;解压后 BOOT-INFO/lib下有其他jar包 因为一个小bug&#xff0c;需要修改这个hisca包下BOOT-INF/lib下的子jar包service-hisca-impl-1.0.0.jar中的一个service类及xml文件 操作步骤&#xff1a; 1、主包jar -xvf …

一文读懂,外贸中的invoice是什么意思?如何制作?

在外贸领域&#xff0c;invoice 这一词汇频繁出现&#xff0c;它对于国际贸易的顺利进行起着至关紧要的作用。本文将深入剖析外贸中 invoice的具体含义、与商业发票的区别&#xff0c;以及其开具流程与注意事项&#xff0c;同时向大家推荐一款高效实用的发票制作工具 ——Zoho …

【论文笔记-TPAMI 2024】FreqFusion:用于密集图像预测的频率感知特征融合

Frequency-aware Feature Fusion for Dense Image Prediction 用于密集图像预测的频率感知特征融合 Abstract&#xff1a;密集图像预测任务要求具有强类别信息和高分辨率精确空间边界细节的特征。为了实现这一点&#xff0c;现代分层模型通常利用特征融合&#xff0c;直接添加…

DeepSeek 专家级操作手册详解

✅作者简介&#xff1a;2022年博客新星 第八。热爱国学的Java后端开发者&#xff0c;修心和技术同步精进。 &#x1f34e;个人主页&#xff1a;趣享先生的博客 &#x1f34a;个人信条&#xff1a;不迁怒&#xff0c;不贰过。小知识&#xff0c;大智慧。 &#x1f49e;当前专栏&…

【Django自学】Django入门:如何使用django开发一个web项目(非常详细)

测试机器&#xff1a;windows11 x64 python版本&#xff1a;3.11 一、安装Django 安装步骤非常简单&#xff0c;使用pip安装就行 pip install django安装完成之后&#xff0c;python的 Scripts 文件夹下&#xff0c;会多一个 django-admin.exe (管理创建django项目的工具)。…