【DKN: Deep Knowledge-Aware Network for News Recommendation】

DKN: Deep Knowledge-Aware Network for News Recommendation

摘要

在线新闻推荐系统旨在解决新闻信息爆炸的问题,为用户进行个性化推荐。 总体而言,新闻语言高度凝练,充满知识实体和常识。 然而,现有的方法并没有意识到这些外部知识,也无法充分发现新闻之间潜在的知识层面的联系。 因此,向用户推荐的结果仅限于简单的模式,并且不能合理扩展。 为了解决上述问题,在本文中,我们提出了一种将知识图表示纳入新闻推荐的深度知识感知网络(DKN)。 DKN 是一个基于内容的深度推荐框架,用于预测点击率。 DKN 的关键组件是一个多通道、词实体对齐的知识感知卷积神经网络(KCNN),它融合了新闻的语义层和知识层表示。 KCNN 将单词和实体视为多个通道,并在卷积过程中明确保持它们的对齐关系。 此外,为了满足用户的多样化兴趣,我们还在 DKN 中设计了一个注意力模块,以动态聚合用户关于当前候选新闻的历史记录。

intrudction

在这里插入图片描述

一般来说,新闻推荐是相当困难的,因为它面临三大挑战。 首先,与电影[9]和餐馆[12]等其他项目不同,新闻文章具有高度时间敏感性,其相关性在短时间内很快就会消失(参见第5.1节)。 过时的新闻经常被较新的新闻取代,这使得协同过滤(CF)[41]等传统的基于 ID 的方法效率较低。 其次,人们在新闻阅读中具有主题敏感性,因为他们通常对多个特定新闻类别感兴趣(参见第 5.5 节)。 如何根据用户对当前候选新闻的多样化阅读历史来动态衡量用户的兴趣是新闻推荐系统的关键。 第三,新闻语言通常高度浓缩,包含大量的知识实体和常识。

为了提取新闻之间深层的逻辑联系,需要在新闻推荐中引入额外的知识图谱信息。 知识图谱是一种有向异构图,其中节点对应实体,边对应关系。

在本文中,我们提出了一种利用外部知识(知识图谱)进行新闻推荐的新颖框架,即深度知识感知网络(DKN)。 DKN 是一种基于内容的点击率 (CTR) 预测模型,以一条候选新闻和一个用户的点击历史作为输入输出用户点击该新闻的概率。 具体来说,对于一条输入新闻,我们首先通过将新闻内容中的每个单词与知识图中的相关实体相关联来丰富其信息。 我们还搜索并使用每个实体的上下文实体集(即知识图中的直接邻居)来提供更多补充和可区分的信息。 然后,我们设计了 DKN 中的一个关键组件,即知识感知卷积神经网络(KCNN),以融合新闻的词级知识级表示并生成知识感知嵌入向量。 与现有的工作[46]不同,KCNN 是:1)多通道,因为它将新闻的词嵌入、实体嵌入和上下文实体嵌入视为多个堆叠通道,就像彩色图像一样; 2)单词实体对齐,因为它在多个通道中对齐单词及其关联实体,并应用变换函数来消除单词嵌入和实体嵌入空间的异质性。

使用 KCNN,我们获得每条新闻的知识感知表示向量。 为了获得用户对当前候选新闻的动态表示,我们使用注意力模块自动将候选新闻与每条点击的新闻进行匹配,并以不同的权重聚合用户的历史记录。 用户的嵌入和候选新闻的嵌入最终由深度神经网络(DNN)进行处理以进行点击率预测。

2 PRELIMINARIES

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

3 PROBLEM FORMULATION

在这里插入图片描述

4 DEEP KNOWLEDGE-AWARE NETWORK

4.1 DKN Framework

在这里插入图片描述

4.2 Knowledge Distillation

在这里插入图片描述
它由四个步骤组成。 首先,为了区分新闻内容中的知识实体,我们利用实体链接技术[31, 36]通过将文本中的提及与知识图中的预定义实体相关联来消除文本中的歧义。 基于这些识别出的实体,我们构建一个子图,并从原始知识图谱中提取它们之间的所有关系链接。 请注意,所识别的实体之间的关系可能是稀疏的并且缺乏多样性。 因此,我们将知识子图扩展到已识别实体的一跳内的所有实体。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4.3 Knowledge-aware CNN

在这里插入图片描述
因此引入了KCNN框架

在KCNN(知识卷积神经网络)架构中,三个嵌入矩阵分别表示标题中的词嵌入、标题对应的实体嵌入和实体的上下文嵌入。具体获取方法如下

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.4 Attention-based User Interest Extraction

在这里插入图片描述

由于用户对新闻主题的兴趣可能是多样的,所以不能用上述将用户点击过的新闻标题嵌入简单相加求平均。作者引入了注意力机制

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/355165.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kubernetes容器运行时:Containerd vs Docke

容器化技术笔记 Kubernetes容器运行时:Containerd vs Docke - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite:http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this arti…

Python数据可视化:直方图、核密度估计图、箱线图、累积分布函数图

本文使用数据来源自2023年数学建模国赛C题,以附件1、附件2数据为基础,通过excel的数据透视表等功能重新汇总了一份新的数据表,从中截取了一部分数据为例用于绘制图表。绘制的图表包括一维直方图、一维核密度估计图、二维直方图、二维核密度估…

ChatGPT提效:告别CRUD

前言 随着AIGC的发展以及大语言模型的成熟,各种AI应用眼花缭乱,以至于我们看到各种新奇的应用都会产生焦虑,我有一天会不会被淘汰?且看后文分析。AIGC的发展与逐渐成熟已经是无可逆转的局势,既然我们打不过为何不加入…

chrome 录制器及性能分析工具的使用

需求背景: 对比不同VPN方案网络延迟的差异。 验证工具: chrome浏览器自带的录制器、性能插件可以完美的解决这个问题。 注意:录制的操作都在当前页面,不存在新开标签页的场景 解决方案: 使用chrome录制器&#xf…

力扣每日一题 6/20 数学+数组

博客主页:誓则盟约系列专栏:IT竞赛 专栏关注博主,后期持续更新系列文章如果有错误感谢请大家批评指出,及时修改感谢大家点赞👍收藏⭐评论✍ 2748.美丽下标对的数目【简单】 题目: 给你一个下标从 0 开始…

Nginx Rewrite技术

一:理解地址重写 与 地址转发的含义。二:理解 Rewrite指令 使用三:理解if指令四:理解防盗链及nginx配置 简介:Rewrite是Nginx服务器提供的一个重要的功能,它可以实现URL重定向功能。 一:理解地…

NodeJs 连接本地 mySql 数据库获取数据

写在前面 今天把 nodejs 连接本地数据库的坑简单的踩一下,为后续写接口做个铺垫 安装 mySql (mac举例子) 安装地址 安装完成大概这个样子,起动起来就行 安装本地数据库连接工具(navicat举例子) 安装地…

EXCEL数据导入HIVE

引言 本文将论述如何将Windows本地的excel表数据,导入到虚拟机Linux系统中的Hadoop生态中的Hive数据仓库中。 实验准备 DBeaver Hive3.1(Hadoop3.1) excel数据表 实验步骤 一、首先打开虚拟机,启动Hadoop,启动h…

Avalonia for VSCode

1、在VSCode中编辑AvaloniaUI界面,在VSCode中搜索Avalonia,并安装。如下图,可以发现Avalonia for VSCode还是预览版。 2、 创建一个Avalonia 项目。 选择项目类型 输入项目名称 选择项目所在文件夹 打开项目 3、项目架构如下图。 4、builde…

项目六 OpenStack虚拟机实例管理

任务一 理解OpenStack计算服务 1.1 •什么是Nova • Nova是OpenStack中的计算服务项目 ,计算虚拟机实例生命周期的所有活动都由 Nova 管理 。 • Nova 提供统一的计算资源 服务。 • Nova 需要下列 OpenStack 服务的 支持。 Keystone :为所有的 OpenSt…

django学习入门系列之第二点《浏览器能识别的标签3》

文章目录 列表表格往期回顾 列表 无序列表 <!-- <ul </ul> 无序列表 --> <ul><li> 内容1 </li><li> 内容2 </li><li> 内容3 </li><li> 内容4 </li> </ul>有序列表 <!-- <ol> &…

第6章 设备驱动程序(6)

目录 6.7 总线系统 6.7.2 PCI总线 6.7.3 USB 6.8 小结 本专栏文章将有70篇左右&#xff0c;欢迎关注&#xff0c;查看后续文章。 6.7 总线系统 6.7.2 PCI总线 PCI由Intel开发&#xff0c;用于替代ISA。 PCI已过时&#xff0c;目前采用PCIe。 PCI特点&#xff1a; 高带宽…

停车场防逃费设备有哪些,捷曜超眸相机怎么样,有哪些功能?

在当今快速发展的城市交通环境中&#xff0c;车场管理面临着诸多挑战&#xff0c;其中防逃费现象尤为突出。频繁的逃费行为不仅给车场运营带来了经济损失&#xff0c;也严重影响了停车场的正常秩序。对于车场防逃费方案中&#xff0c;超眸相机&#xff0c;以其尖端的高清成像技…

C++学习(23)

#学习自用# union 共用体和结构体相似&#xff0c;但是共用体一次只能占用一个成员的内存&#xff0c;所有成员共用同一地址。 #include<iostream> using namespace std; union A {int int_val;float float_val; }a; int main() {a.float_val 2.0f;cout << a.f…

浏览器加了token的header导致部分网页打不开

因为测试加了个token&#xff0c;忘记去掉&#xff0c;导致一些系统进不去&#xff0c;只能用无痕浏览器打开&#xff0c;后来发现是因为token的原因

零散的面试题

★1.java常见的引用类型 强:普通的变量引用 软:内存够时,GC不会主动删除,内存不够时,GC会删除 弱:一旦执行GC就会被删除 虚:用了感觉没用 ★2.JDK1.8新特性 lambda表达式(极大简化了匿名内部类的创建&#xff0c;促进函数式编程的风格)函数式接口(只能有一个抽象方法的接口 )日…

Nexus安卓木马分析报告

概述 2023年3月21日晚上&#xff0c;链安与中睿天下联合研发的监控系统检测到一种新型安卓木马。在经过睿士沙箱系统捕获样本之后&#xff0c;发现该安卓木马极有可能是原安卓网银盗号木马SOVA的变种。与此同时&#xff0c;意大利安全公司Cleafy发布了一篇题为《Nexus&#xf…

一款Wordpress网站导航主题,带昼夜切换功能

Wordpress网站导航主题&#xff0c;带昼夜切换功能。 基于wordpress&#xff0c;部署和使用都比较方便。 界面比较简洁大方。后台管理功能也比较全面&#xff0c;值得一试。 这款主题界面、功能都非常简洁。 作者把这款定位为简约导航主题&#xff0c;所以这款wordpress导航…

飞书API 2-1:如何通过 API 创建文件夹?

本文探讨如何通过飞书的 API 来创建文件夹。通过 API 创建的文件夹&#xff0c;一般是放在共享空间&#xff0c;如果要放在个人空间&#xff0c;建议手动创建。 查看 API 文档 API 路径&#xff0c;可在飞书开放平台的服务端 API&#xff0c;依次查找云文档>云空间>文件…

MavenPlus插件的基础功能完善

本次更新主要是在初版的searchEverywhere的基础上增加了pom.xml文件编辑器&#xff0c;目前的界面布局如下&#xff0c;进行适当说明&#xff1a; 打开pom文件后&#xff0c;你会得到如上图所示的布局页面&#xff0c;数据会同步显示 如果有冲突信息&#xff0c;则会以红色显示…