《社交电商中的分享推荐研究》论文阅读笔记

A Study of Share Recommendation in Social E-commerce

《社交电商中的分享推荐研究》
该论文收录于35th AAAI 2021: Virtual Event
CCF A 类会议
原文链接


文章目录

  • A Study of Share Recommendation in Social E-commerce
  • 一、摘要
  • 二、简介
    • 分享推荐需要解决以下问题:
      • 1、丰富的异构信息
      • 2、复杂的三元交互
      • 3、非对称分享行为
    • 本文贡献
  • 三、正文部分
    • HGSRec模型
      • 1、初始化节点向量
      • 2、三方异构图神经网络
      • 3、双重共同注意机制 Co-Attention Mechanism
      • 4、传递三元组表示
  • 四、实验结果
    • 数据集
    • 基线模型
    • 性能评估
    • 注意力分析
    • 在线实验

一、摘要

社交电商的蓬勃发展催生了多样化的推荐需求,并伴随着一种新的推荐模式——分享推荐

与传统的二元推荐不同,分享推荐模型是<User, Item, Friend>之间的三元交互,旨在向想要分享特定项目的用户推荐最有可能的朋友,逐渐成为社交电商不可或缺的服务。

分享推荐通过整合社交关系和购买行为,提高了用户粘性并通过用户影响力变现

但是遇到了三个挑战:丰富的异构信息、复杂的三元交互和不对称的分享行为。

本文提出了一种基于异构图神经网络的共享推荐模型,称为 HGSRec
HGSRec 包括一个三方异构 GNN 来描述用户和项目的多重特征,然后通过使用双重共同注意机制捕获潜在的三元依赖关系来动态融合这些信息,然后利用三元组来描述共享动作的不对称性并预测是否发生共享操作。

离线实验证明了 HGSRec 的优越性,与现有技术相比有显著改进(11.7%-14.5%),淘宝平台上的在线 A/B 测试进一步证明了 HGSRec 的高工业实用性和稳定性。

分享推荐和二元推荐的比较:
在这里插入图片描述

二、简介

由于以下特点,分享推荐一直是社交电子商务中一种独特的推荐模式:
首先,分享推荐结合了社交关系和物品推荐的优点。大多数用户同时存在于商业网络和社交网络中,因此用户非常了解他的购买项目,也了解他的朋友。分享推荐不仅可以增强用户的粘性和活跃度,还可以将用户影响力变现(例如注意力经济和网红经济)。其次,分享推荐具有可靠性。由于用户既知道推荐的商品,也了解他的朋友,所以用户的分享行为对他的朋友来说是可信的,这增加了推荐的可靠性,从而有利于购买行为。

分享推荐的目标是预测 <User、Item、Friend>之间的三元交互,即用户是否会与朋友分享某项,最大化概率 P (u3|u2, i3)。

分享推荐需要解决以下问题:

1、丰富的异构信息

分享推荐通常包含复杂的异构信息,包括用户和物品之间复杂的交互,以及大量用户和物品的特征信息。这样的例子如下图所示。需要处理复杂的交互并同时利用不同的特征的问题。
在这里插入图片描述

2、复杂的三元交互

需要考虑一个分享行为的适用性,评估三个对象(例如,u2,i3,u​​3)在分享动作中的匹配程度。根据推荐物品的特点,用户会将其推荐给合适的朋友,因此应该考虑该物品对用户(或朋友)的影响。
在这里插入图片描述
在上图中,用户 u2 会将鞋子 i3 分享给他的同学 u3,而不是他的妈妈 u1。所以需要对用户、物品和朋友的三元交互进行建模,考虑它们的适用性。

3、非对称分享行为

分享动作是不对称且不可逆的,这意味着如果交换用户和朋友的角色,分享行为可能不会发生。
用户 u2 可以将一件女式大衣 i1 分享给他的妈妈 u1,而用户 u1 不会将女式大衣 i1 分享给她的儿子 u2。因此,理想的模型应该考虑共享行为的不对称性。

本文贡献

本文首先研究了分享推荐问题,并提出了一种基于异构图神经网络的分享推荐模型(HGSRec)。将分享推荐系统建模为属性异构图以集成丰富的异构信息,然后设计 HGSRec 来学习 u、i、v 的嵌入向量并预测分享动作 hu、i、vi 发生的概率。
具体来说,在通过编码丰富的节点特征初始化节点嵌入之后,设计了一个三方异构 GNN,通过聚合它们的基于meta-path的邻居来分别学习 u、i、v 的嵌入,这使得 HGSR 能够灵活地融合不同方面的信息。动态融合不同meta-path的时候利用了双重注意力机制。

三、正文部分

HGSRec模型

HGSRec 的总体框架: (a) 通过特征嵌入初始化用户和项目嵌入。 (b) 通过三方异构图神经网络更新节点嵌入。 © 通过双重共同注意机制动态融合嵌入。 (d) 通过传递三元组表示对非对称共享行为进行建模。

在这里插入图片描述

1、初始化节点向量

首先将用户、商品、朋友的特征信息初始化这些节点的嵌入向量
特征嵌入有两个好处:(1)在实际应用中,每天都有大量新节点。特征嵌入通过利用它们的特征有效地为以前未见过的节点生成嵌入。 (2) 特征数量远少于节点数量,显着减少了可学习参数的数量。

对于节点的第k个特征,初始化一个特征向量矩阵Mfk
u 的第 k 个特征的向量如下所示
在这里插入图片描述
所以用户u的节点特征用下面的式子表示:
在这里插入图片描述
WU是权重矩阵,bU是偏置向量。

物品和朋友的向量初始化都是一样的过程

2、三方异构图神经网络

本文提出了三元异构 GNN,分别通过相应的异构 GNN(即 HeteGNNU 、 HeteGNNI 和 HeteGNNV)来学习 u、i、v 的嵌入。异构 GNN 通常遵循分层方式:它首先通过一个metapath聚合来自一种邻居的信息,并在节点级别学习语义特定的节点嵌入。然后,它聚合来自不同元路径的多个语义,并在语义级别融合一组特定于语义的节点嵌入。

具体来说,给定一个用户 u 和 k1 个与该用户相关的元路径,HeteGNNU 能够获得 k1 个语义特定的用户嵌入
在这里插入图片描述
不同节点的基于元路径的邻居的数量可能会有很大差异,因此我们需要对固定数量的邻居进行采样。随机采样策略会导致大量计算消耗和丢失重要节点。
本文提出了一种 top-N 语义采样策略:(1)如果基于元路径的邻居的数量大于固定数量 N,我们基于连接强度指标筛选(例如,多少次用户查看该物品)。 (2) 否则,我们采用重复采样来获得 N 个基于元路径的邻居。

本文提出了一种语义聚合器SemAgg,用于聚合用户u和对应的meta-path ΦU下的邻居:
在这里插入图片描述
考虑到时间效率,本文采用 MeanPooling 来加速聚合处理以加快预测速度。
在这里插入图片描述
为了凸显用户u本身属性的重要性,将初始嵌入 xu 和基于元路径的嵌入连接起来,得到语义特定的用户嵌入:
在这里插入图片描述
对于用户U的k1个metapath{ΦU1U2 , · · · ,ΦUk }可以学习到k1个特征向量在这里插入图片描述
对于friend对象v们,也一样会得到:
在这里插入图片描述
由于项目的特征比用户简单且稳定,我们只采用一个元路径ΦI,通过 HeteGNNI 得到项目 i 的嵌入XiΦ :
xΦI i

3、双重共同注意机制 Co-Attention Mechanism

在获得一组特定于语义的节点嵌入后,接下来的目标是基于复杂的三元交互 hu、i、vi 正确融合它们。因此,考虑到项目 i 的影响,设计了一种双重共同注意机制来动态融合 u(或 v)在不同元路径下的嵌入。

该部分由U和I的共同注意力机制CoAttU,I,和V和I的共同注意力机制CoAttV,I两部分组成

具体来说,它学习了 hu、i、vi 元路径的交互特定注意力值,并获得了 u、v 的最合适的嵌入,具有以下好处:(1)它增强了 hu、i、vi 的依赖性,使 HGSRec更完整。 (2) 它动态融合了 u(或 v)的嵌入,提高了共享适用性。

CoAttU,I为用户U学习一组特定于与物品交互的注意力权重:
在这里插入图片描述
具体来说,我们将 u 和 i 的语义嵌入向量连接起来,并将它们投影到共同注意空间中。然后,我们采用共同注意向量 qU,I 来学习元路径对用户 u 的重要性。 metapathΦUm 对 U 在相互作用 U, I中的重要性
在这里插入图片描述
接下来对权重进行softmax归一化:
在这里插入图片描述
进而得到了U的嵌入向量如下:
在这里插入图片描述
”朋友“对象V和U的过程一样
对于物品I,因为只有一种metapath所以依旧是XiΦ,没有注意力部分

4、传递三元组表示

为了预测分享行为,我们需要基于u, i, v,通过hu, hi, hv, 构建一个三元组表示数ru,i,v
我们首先通过三个特定类型的 MLP,将三个对象的H属性投影到同样的向量空间上
在这里插入图片描述

构建三元组表示 ru,i,v 的一种简单方法是连接所有节点嵌入( zu||zi||zv)
但是简单的连接并不能明确捕捉分享动作的显着特征:
(1)分享推荐实际上是基于用户和项目对候选朋友进行排名(例如,计算 zu + zi 和 zv 之间的相似度),所以分享动作是不对称的,用户和朋友的角色不能互换。 (2)item描述了用户和好友之间的转换,是建立分享动作不可缺少的桥梁。

受”关系翻译“的启发,本文提出了一个可传递的三元组表示 ru,i,v 来通过 itemtranslating 显式地建模共享动作的特征,如下所示:
在这里插入图片描述
然后将其放到新的一个感知机中,得到一个预测指标:
在这里插入图片描述
定义了如下的交叉熵损失函数,y是三元组的标签。
在这里插入图片描述
通过该损失函数的梯度下降,最后可以训练出模型

四、实验结果

数据集

从淘宝平台收集数据,范围从 2019/10/09 到 2019/10/14
每个样本包含一个分享动作 hu,i,vi和相应的标签 yu,i,v∈ {0, 1}。
为用户选择了四个元路径,包括 U-s-U、U-b-Ib-U 和 U-v-I-v-U,为商品选择 U-b-I。

在离线实验中,使用最后一天(即 2019/10/14)作为验证集,之前的 3/4/5 天作为训练集,分别标记为 3 天、4 天和 5 天.为了全面评估结果,将每个训练集的大小从 40% 更改为 100%

基线模型

选择基于特征的模型(即 LR、DNN 和 XGBoost)和 GNN 模型(即 GraphSAGE、IGC 和 MEIRec)作为基线
为了验证 HGSRec 中的精细设计,还测试了 HGSRec 的两个变体(HGSRec\att 和 HGSRec\tra)
尽管深度模型依赖于随机性,其性能随随机种子的不同而变化,但它们在大规模淘宝数据集上的性能相当稳定(即 HGSRec 的方差小于 0.001)

性能评估

在这里插入图片描述

如表所示,我们有以下观察结果:
(1) HGSRec 始终比所有基线表现更好,并有显着改进。与最佳baseline相比,提升幅度高达11.7%-14.5%,表明HGSRec的优越性。
(2) 大多数 GNN(即 GraphSAGE、IGC 和 MEIRec)优于基于特征的方法(即 LR、DNN 和 XGBoost),表明结构信息的重要性。当深入了解这些方法时,我们可以发现,如果采用三元交互,三方版本(即 IGC+ 和 MEIRec+)的性能明显优于原始版本。它进一步证实了为股票推荐建模三元交互的好处。
(3) 将 HGSRec 与其变体的性能进行比较,我们可以发现 HGSRec 的性能最好。 HGSRec\att 的退化表明了双重共同注意机制的有效性,而 HGSRec\tra 的退化验证了传递三元组表示的优越性。请注意,HGSRec\tra 的退化比 HGSRec\att 的退化更显着,这意味着传递三元组表示可能比双重共同注意机制做出更高的贡献。

注意力分析

在这里插入图片描述
Dual co-attention 机制可以动态融合用户和朋友关于不同项目的多个嵌入,并提高共享适用性。我们首先通过图 4(a) 中 3 天数据集上用户注意力分布的箱线图呈现宏观层面的分析。请注意,朋友上的注意力值分布也显示出类似的现象。可以看出,元路径的注意力分布不同,U-b-I-b-U的注意力值最大,方差较高,说明这条元路径对大多数用户来说是最重要的。原因是U-b-I-bU与反映最强用户偏好的用户购买行为有关。 U-b-I-b-U 的较高方差也意味着其重要性对于不同的用户差异很大。我们进一步用单个元路径测试 HGSRec,并在图 4(b) 中用相应的平均注意力值显示它们的性能。与注意力分布一致,U-b-I-b-U 是最有用的元路径,它实现了最高的 AUC 并获得了最大的注意力值。
在这里插入图片描述

在线实验

在线服务需要满足以下要求: (1)海量数据的存储和处理。分享推荐系统以邻接表的形式存储在 MaxCompute 中,以提高内存效率。 (2) 异常股份行为。我们过滤异常的分享行为(例如,一个用户在 24 小时内与他的朋友分享了超过数千个项目)。 (3) 新功能和缺失功能。每天都有新功能出现,因此我们利用哈希函数来映射所有功能,在发生哈希冲突时会导致性能略有下降。缺少的功能用特定的标记填充。在线结果范围从2020/01/08到2020/02/02(25天)如图7所示。这里我们选择UCTR(UCTR=Unique Click/Unique Visitor)进行在线评估。 UCTR 越大,性能越好。长期观察表明,HGSRec 的性能始终优于 XGBoost,差距很大,证明了 HGSRec 的高工业实用性和稳定性。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/66439.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PHP毕业设计项目作品源码选题(2)电子商务网上购物商城毕业设计毕设作品开题报告

PHP毕业设计项目作品源码选题&#xff08;2&#xff09;电子商务网上购物商城毕业设计毕设作品开题报告 本次论文研究的内容主要模块包括以下几点&#xff1a; 用户首次登陆系统需要注册一个用户账号&#xff0c;用户在登录平台后&#xff0c;可以进行平台的操作。 (1)登录功…

代码+论文+ppt+毕业设计 :基于电商数据的协同过滤算法的用户个性化推荐项目

1.1.1 课题来源于背景 本文选取的研究对象是某家法律电商平台&#xff0c;由于网站访问量的不断上升和网站内容的不断增多&#xff0c;用户很难从网站中及时找到自己想了解和感兴趣的相关信息&#xff0c;这极大地影响了用户的使用体验&#xff0c;导致很多用户的流失。本文决定…

【php毕业设计】基于php+mysql+apache的在线购物网站设计与实现(毕业论文+程序源码)——在线购物网站

基于phpmysqlapache的在线购物网站设计与实现&#xff08;毕业论文程序源码&#xff09; 大家好&#xff0c;今天给大家介绍基于phpmysqlapache的在线购物网站设计与实现&#xff0c;文章末尾附有本毕业设计的论文和源码下载地址哦。需要下载开题报告PPT模板及论文答辩PPT模板…

HTML5期末大作业:电商网站设计——仿淘宝电商网站管理系统21页(含毕业设计论文7500字) HTML+CSS+JavaScript

HTML5期末大作业&#xff1a;电商网站设计——仿淘宝电商网站管理系统21页(含毕业设计论文7500字) HTMLCSSJavaScript 常见网页设计作业题材有 个人、 美食、 公司、 学校、 旅游、 电商、 宠物、 电器、 茶叶、 家居、 酒店、 舞蹈、 动漫、 明星、 服装、 体育、 化妆品、 物…

农产品商城毕业设计,农产品销售系统毕业设计,农产品电商毕业设计论文方案需求分析作品参考

项目背景和意义 目的&#xff1a;本课题主要目标是设计并能够实现一个基于web网页的多用户商城系统&#xff0c;整个网站项目使用了B/S架构&#xff0c;基于python的Django框架下开发&#xff1b;用户通过登录网站&#xff0c;查询商品&#xff0c;购买商品&#xff0c;下单&am…

ChatGPT打破了图灵测试——评估人工智能新方法的竞赛正在进行

世界上最好的人工智能&#xff08;AI&#xff09;系统可以通过艰难的考试&#xff0c;写出令人信服的人类论文&#xff0c;流利地聊天&#xff0c;以至于许多人发现它们的输出与人类无异。他们不能做什么&#xff1f;解决简单的视觉逻辑谜题。 在一个由一系列排列在屏幕上的颜色…

目标检测算法——YOLOv5/v7改进之结合最强视觉识别模块CotNet(Transformer)

💖💖>>>加勒比海带,QQ2479200884<<<💖💖 🍀🍀>>>【YOLO魔法搭配&论文投稿咨询】<<<🍀 ✨✨>>>学习交流 | 温澜潮生 | 合作共赢 | 共同进步<<<✨✨ 📚📚>>>人工智能 | 计算机视觉 | …

案例研究ㅣ中国银联:图技术发展与应用实践

导读 “图”是事物及关联关系的抽象表达&#xff0c;现实世界中存在着大量可以用图来表示的关系数据&#xff0c;而用来存储和计算这些关系数据的就是图数据库。 2023年7月6日下午&#xff0c;由世界人工智能大会组委会办公室指导&#xff0c;创邻科技主办的世界人工智能大会…

大模型跨界研究:计算精神病学发现,大模型居然比人类更焦虑

夕小瑶科技说 原创作者 | 小戏、iven 纽约时报的记者凯文鲁斯&#xff08;Kevin Roose&#xff09;在 2 月份和必应的大模型 Sydney 聊了两个小时天&#xff0c;却惊讶的收到了这样一条回复“我是 Sydney&#xff0c;我爱上了你”。 鲁斯向 Sydney 讲了一些关于荣格“黑暗自我”…

不好意思,都ChatGPT-5了,IDEA 该换了!

因公众号更改推送规则&#xff0c;请点“在看”并加“星标”第一时间获取精彩技术分享 点击关注#互联网架构师公众号&#xff0c;领取架构师全套资料 都在这里 0、2T架构师学习资料干货分 上一篇&#xff1a;ChatGPT研究框架&#xff08;80页PPT&#xff0c;附下载&#xff09;…

一日一技:助力大语言模型训练,无压力爬取六百亿网页

这是「进击的Coder」的第 832 篇技术分享 作者&#xff1a;kingname 来源&#xff1a;未闻 Code “ 阅读本文大概需要 8 分钟。 ” ChatGPT 一炮而红&#xff0c;让国内很多公司开始做大语言模型。然后他们很快就遇到了第一个问题&#xff0c;训练数据怎么来。有些公司去买数据…

GoDaddy惨遭网页插入JavaScript脚本

2019独角兽企业重金招聘Python工程师标准>>> Oracle软件工程师Igor Kromin在自己的部落格揭露&#xff0c;他意外发现网域注册与网页托管商GoDaddy&#xff0c;会在没有经过使用者同意之下&#xff0c;将JavaScript脚本注入到托管网站中。Igor Kromin之所以发现GoDa…

围观!有钱人是如何惨遭被绿的?

来 源&#xff1a;费加罗夫人&#xff08;ID&#xff1a;iiiFigaro&#xff09; 要想生活过得去 基金难免有点绿 不如我们就直接当一回勇士 直面绿绿的人生 前方高能 请欣赏迷人的绿色风景 基金能涨多少 就看各位爸爸的在看有多少了???? *关于作者&#xff1a;费加罗夫人…

阿里内网惨遭开源的“顶级Nginx完全开发指南”

Nginx是著名的Web服务器&#xff0c;性能优异&#xff0c;运行效率远超传统的 Apache、Tomcat&#xff0c;广泛应用于国内外诸多顶级互联网公司。 Nginx功能强大,架构复杂,学习、维护和开发的门槛较高。为了帮助大家跨越这一障碍&#xff0c;小编就给大家分享一份据说是华为大…

免费换电池还倒塞用户200,iPhone惨遭“耐用”反噬

多年来 iPhone 最为诟病的几个缺点之一肯定少不了电池。 在 Android 已经普及4、5000mAh 大电池加快充组合的情况下&#xff0c;iPhone 仅有 Pro Max&#xff08;Plus&#xff09;勉强及格。 更难受的是今年3月&#xff0c;官方换电池还迎来了幅度不小的涨价。 苹果这是在建议我…

一经推出就惨遭GitHub哄抢,什么SQL优化笔记如此出众?

收获不止SQL的优化&#xff0c;抓住SQL的本质 收获&#xff0c;不止SQL优化&#xff0c;真正实用好工具。从数据库体系结构、表和索引设计、高效SQL写法、高级SQL语法、多种优化工具等知识&#xff0c;甚至还得分析业务特点&#xff0c;以及了解优化器的缺点都提供了很好的方法…

android8.0索尼z5,Z5 惨遭抛弃?索尼公布 Android 8.0 升级机型

索尼在 IFA 上发布了预搭载 Android 8.0 奥利奥的 Xperia XZ1/XZ1 Compact 后&#xff0c;同时放出了可以升级 Android O 的具体机型名单&#xff0c;我们来看一下。Xperia X Xperia X Performance Xperia XZ Xperia X Compact Xperia XZ Premium Xperia XZs Xperia XA1 Xperia…

Windows Phone惨遭微软放弃

微软在电脑操作系统上的用户保有量一直处于遥遥领先的地位&#xff0c;特别是最新的Windows 10系统&#xff0c;一经推出&#xff0c;市场表现就比较好&#xff0c;但相比起来&#xff0c;微软的手机操作系统Windows Phone就被贴上“差等生”的标签了。 自微软2013年9月2日收购…

腾讯申请元宇宙相关商标,惨遭被驳回

根据企查查信息显示&#xff1a;最近&#xff0c;腾讯音乐娱乐科技&#xff08;深圳&#xff09;有限公司申请的“律动元宇宙”商标遭到驳回&#xff0c;目前商标状态为等待驳回复审&#xff0c;商标申请日期为 2021 年 9 月。 除了腾讯&#xff0c;此前多家公司申请元宇宙相关…

mate10 Android 功耗,华为mate10续航评测比拼惨遭完爆

国行华为mate10正式发布&#xff0c;被花粉们最关心的价格十分感人&#xff0c;售价3899元起&#xff01;除了价格还有最关心的就是电池续航&#xff0c;据了解这次华为mate10和mate10 pro电池容量都是4000毫安。就在国行mate10发布后&#xff0c;国外就有测评达人将一加5、三星…