论文导读 | 社交网络上的信息传播预测

作者:北京大学苟向阳

 

编者按

现代社交网络极大地促进了信息的生成和传播,也加剧了不同信息对用户注意力的竞争。

对于一条信息的传播范围进行预测,能够帮助运营者和用户提前发现潜在的热点,从而为其决策提供指导。

本文将介绍两种基于深度学习的信息传播预测算法。

 

问题定义

信息传播预测,即为基于一条信息当前的传播路径,预测信息未来的传播范围。具体来说。一条信息在社交网络上的传播可以被抽象为一个传播图 (cascade graph), 如下图所示。传播图上的每一个点代表社交网络上的一个用户,而边则表示该信息被用户 v 转发自用户 u 。指从该信息第一次被发布(下图中的)到该次转发之间经过的时间。给定一个观察窗口, 我们已知此时间窗口内的所有转发,即 T 时刻为止的传播图。我们需要以此为根据,预测该信息未来还会被转发多少次。

 

 

背景工作介绍

早期的信息传播预测主要有两类方式。一类是基于特征的方法:这类方法靠使用者手工提取特征,如信息的内容特征,当前传播的时序特征,结构特征,传播路径上的用户特征等。基于这些特征,使用回归 (regression) 算法来预测信息转发次数。这一类方法的效果非常依赖于特征的提取,对于不同的问题,需要使用者根据自己经验来提取合适的特征。第二类是生成式算法,这类算法设计模型来模拟信息传播机制,力图将信息传播的主要特点保留在模型中,然后运用该模型来计算每一条信息在未来的传播范围。这类算法的主要问题在于预测能力有限,因为其使用的模型一般来自于一些泛用数学模型,如强化泊松过程,而不能准确模拟信息传播。本文介绍的两种方法为生成类算法与深度学习算法的结合。它们将生成类方法中利用的信息传播特点,如自我激励(self-exciting),衰减机制(time decay effect)等,与深度学习相结合,从而在保持可解释性的同时获得更强的预测能力。

DeepHawkes

DeepHawkes 算法来自于2017年CIKM论文《DeepHawkes:  Bridging the Gap between Prediction and Understanding of Information Cascades》[1]。该算法将Hawkes 过程与深度学习方法结合。它利用了Hawkes过程中的3个主要机制:1. 用户影响力,不同的用户具有不同的影响力,高影响力用户对于信息传播具有更大贡献。2. 自我激励机制:历史上的每一次转发都使得该信息在未来被转发的可能性提升。3.时间衰减机制:历史转发的影响力会随着时间衰减。

DeepHawkes结构如下图。它将传播图表示为一系列的传播路径,每一条传播路径代表信息从起始点到达某一个用户的过程。DeepHawkes 由 3个部分组成,第一部分为用户embedding,将用户的身份信息embedding 为一个低维的向量,从而表征用户的影响力信息;第二部分为路径编码,使用循环神经网络 (Recurrent Neural Network, RNN) 生成每一条传播路径的向量表示;第三部分为结合时间衰减的加和池化,使用监督学习得到不同时间的衰减系数,然后将每一条路径的向量表示与相应的衰减系数相乘后进行带权加和池化,得到传播图的向量表示。最后,利用一个多层感知机从传播图的向量表示得到对于未来转发次数的预测。下面我们对每一个部分进行简要介绍。

 

 

用户embedding

为了得到每一个用户身份信息的embedding, DeepHawkes 使用了监督学习的方法,每一个用户被表示为一个的 one-hot 向量,其中 N 为用户的总数。所有 N 个用户共享一个 embedding matrix, 其中 K 为一个可调节的参数,代表 embedding 的维度。这个embedding matrix把每一个用户转化为一个空间内的向量表示:

注意embedding矩阵 在将在整个神经网络的训练过程中通过监督学习来获得。

 

路径编码

 

在获得了用户的embedding 向量后,DeepHawkes使用RNN来编码每一条传播路径。具体来说,DeepHawkes使用一个GRU (Gate Recurrent Unit)[2],第k 个隐状态 (hidden state) 计算如下:

复位门 (reset gate):

其中为路径上第k个用户的embedding,为第k-1个隐状态,,为参数矩阵, σ(∙) 表示sigmoid 函数。

更新门 (update gate):

其中 

隐状态:

其中

表示逐个元素相乘 (element-wise product),,,

最终的隐状态将作为该路径的向量表示。所有路径的向量表示将在下一个步骤被加权求和来得到传播图的向量表示,这体现了Hawkes过程的自激励机制,即每一次转发都会提高该信息在未来被转发的概率。

 

时间衰减

一次转发的影响力会随着时间的流逝而下降,为了模拟这一过程,DeepHawkes将观察窗口(0,T] 切分为L个等长的片段,每一个片段对应一个衰减系数 . 对于一个时间为的转发 (为该转发距离该信息第一次发布,即0时刻的时间差),其对应的衰减系数为, 其中

每一条传播路径对应的衰减系数由该路径上最后一次转发的时间决定。最终传播图的向量表示为

其中为路径总数。

 

输出层

输出层为一个多层感知机(multi-layer perceptron),以传播图的向量表示 c 为输入,输出观察窗口结束时刻 T 之后还会有多少次转发。整个神经网络的目标函数为

其中 M 为训练集中传M播图总数,为第 i 个传播图在观察窗口结束时刻T之后的转发次数,为神经网络预测的次数。训练过程中,以最小化此目标函数为目的进行参数优化。

 

CasCN:

CasCN 来自于2019年ICDE论文《Information Diffusion Prediction via Recurrent Cascades Convolution》[3],其思想与DeepHawkes类似,都利用了自激励机制和时间衰减机制,其与DeepHawkes的主要区别在于产生传播图的向量表示的过程中,使用了GCN(图卷积神经网络)来更好地提取传播图的拓扑结构信息,其网络结构如下图:

子图序列的抽取

与DeepHawkes不同,CasCN将传播图组织为一个的子图序列(sub-cascade graphsequence) 而非传播路径。序列包含一系列的子图 , 第一个子图只包含信息起始点,之后的每一个子图相比上一个子图增加一条转发。下图为一示例:

 

时序与拓扑模型

与DeepHawkes相同,CasCN使用RNN来保存传播图的时序特征,但不同点在于,CasCN的RNN是基于子图序列而非传播路径的,同时,它使用了GCN来提取传播图的拓扑结构。具体来说,它用Defferards graph convNet [4]中的图卷积操作替代了LSTM (long short-term memory) [5]中的矩阵乘法操作。LSTM的每一层接受子图序列中一个子图的邻接矩阵作为输入信号,结合上一层的隐状态 (hidden state)和细胞状态 (cell state), 计算本层的hidden state 和 cell state.

第t层的各个门状态如下:

其中表示以为参数矩阵,基于传播图的拉普拉斯矩阵的图卷积操作。在这步操作中有一些技术点,例如有向图的拉普拉斯矩阵的计算,使用切比雪夫展开来降低计算代价等,论文中有一章节进行详细介绍,具体操作在此不做过多叙述。W,U,V,b为不同的参数矩阵。

最终该层的隐状态 (hidden state)和细胞状态 (cell state) 如下所示:

 

 

时间衰减与最终输出

CasCN使用的时间衰减机制与DeepHawkes相同,最终传播图的向量表示为

为观察窗口内信息转发的总次数,为LSTM第j层的隐状态,到第 j 次转发为止的子图序列都被编码在了这个隐状态中, 为第j次转发的时间, 为对应的衰减系数,定义和DeepHawkes 相同,也是通过监督学习获得的。

 

之后,CasCN 同样使用多层感知机预测T之后还会有多少次转发,并使用和DeepHawkes相同的目标函数,在此不作赘述。

 

实验对比

下图实验节选自CasCN论文,实验使用的数据集分别为新浪微博的微博转发数据集 (Weibo Dataset) 和论文开源网站 arXiv 上的论文引用数据集(HEP-PH),M 代表不同的方法,而 T 则表示观察窗口的大小。实验使用 mean square log-transformed error (MSLE)作为准确率指标

P 为测试集大小,为第 i 个传播图在观察窗口之后增加的转发次数,为神经网络预测的次数。MSLE的计算方式与两种算法的目标函数相同。从图中我们可以看出,DeepHawkes 与CasCN 具有目前最好的预测效果,CasCN精度要高于DeepHawkes。

 

参考文献

 

[1].   Cao Q, Shen H, Cen K, et al.Deephawkes: Bridging the gap between prediction and understanding ofinformation cascades[C]//Proceedings of the 2017 ACM on Conference onInformation and Knowledge Management. 2017: 1149-1158.

[2].    Cho, Kyunghyun, et al."Learning Phrase Representations using RNN Encoder–Decoder for StatisticalMachine Translation." Empirical methods in natural language processing,2014, 1724-1734

[3].    Chen, Xueqin, et al."Information diffusion prediction via recurrent cascadesconvolution." 2019 IEEE 35th International Conference on DataEngineering (ICDE). IEEE, 2019.

[4].    Defferrard, Michaël, XavierBresson, and Pierre Vandergheynst. "Convolutional neural networks ongraphs with fast localized spectral filtering." Advances in neuralinformation processing systems. 2016.

[5].     Hochreiter, Sepp, and JürgenSchmidhuber. "Long short-term memory." Neural computation 9.8(1997): 1735-1780.

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/45005.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

风变MTP管理课,助力职场乘风破浪

相信很多人在自己的职场规划中,最终都是奔着管理岗而去的。然而,管理人员也并不是那么容易做的,因为做了管理岗就意味着要有一定的领导力,要会管理员工,要学会把任务分发给员工,学会识人、用人等。所以对于…

基于jsp的新闻发布系统

新闻发布系统 下面就让我们来说一说基于jsp的新闻发布系统,其中使用的技术有JavaBean、fillter、数据库等,能够实现新闻的发布功能,在发布之后能够进行对每一条新闻的删除、修改、或者继续增加新的文章,最后还能够进行查询功能&am…

宋宇-课堂对话领域研究热点与 前沿趋势探究

好家伙。。。 看这种论文容易自闭,,,怎么能写这么好呢。。。 下次看看博士的论文吧还是。。 定义 课堂对话( classroom dialogue /discourse) 是师生间或者生生间围绕教育教 学目标的实现所形成的良性的交流活动。[1&#xff3d…

【论文阅读】社交网络传播最大化问题-03

Leader-aware community detection in complex networks Leader-aware community detection algorithm - 领导感知社区检测算法 创新点相关工作概念定义基础概念创新概念1. (领导力)2. (边缘紧性)3.(引力) …

用WEB OF SCIENCE助力创新性科学研究

用WEB OF SCIENCE助力创新性科学研究 Web of science是什么?web of science 怎么用?2.1 这个领域值得研究吗?-检索创建引文报告2.2若可行,那该领域进展如何?-看综述2.3 选择自己在该领域的->细分方向(或…

【论文阅读】社交网络传播最大化问题-04

Efficient Influence Maximization in Social Networks 相关工作改进的贪心算法对独立级联模型的改进对加权级联模型的改进 改进度折扣算法 影响力最大化:在社交网络中找到一小部分能够最大化传播影响力的节点(种子节点)。 一是改进原有的贪心算法,进一步…

【论文阅读】用于自动中文作文评分的多阶段预训练

摘要 这篇文章提出了一个基于预训练的中文作品评分方法。方法包含3个成分:弱监督预训练,有监督的交叉提示(cross-prompt)微调 和 有监督的目标提示(target-prompt)微调。一个文章打分器首先在一个大的文章…

【论文阅读】社交网络传播最大化问题-01

问题定义:构建传播最大化模型(最大化末态时的激活节点数量 )& 确定最具影响力节点 思考问题: 影响节点影响力的因素?有向图和无向图的模型构建区别? 定义参数: 节点影响力的取值范围节点…

谣言检测论文精读——12.2020-基于多级融合的多模态谣言检测模型

时间:2020 这篇文章解决的问题 各模态间的语义信息在特征空间是 异构的,这可能会导致以下两个问题:①多模态之间的信息融合不够充分;②模型过于依赖各模态间的信息完整度 (可能有的事件只存在文本信息,而有的事件只存在图片 信息)。 作者如何解决这个问题的 作…

2023最新新闻文章发布系统的设计与实现(毕业设计+论文+开题报告+运行)

摘 要 随着计算机技术的迅速发展,网络正以一种前所未有的冲击力影响着人类的生产和生活。网络的快速发展,颠覆了传统的信息传播方式,冲破了传统的时间,空间的局限性,继而引发了人类阅读方式的变革。现如今&#xff0…

新闻发布|基于JavaWeb实现新闻发布管理系统+论文+PPT

作者主页:编程千纸鹤 作者简介:Java、前端、Python开发多年,做过高程,项目经理,架构师 主要内容:Java项目开发、毕业设计开发、面试技术整理、最新技术分享 收藏点赞不迷路 关注作者有好处 文末获得源码 项…

柯桥托业TOEIC考试和PETS哪个含金量高?

说到对职场有益的证书,无外乎托业和BEC证书。但还有一种面向社会人士的考试,也有很多小伙伴很感兴趣。那就是PETS考试。 很多小伙伴也很好奇托业和PETS的区别,今天来给大家科普下喽。 TOEIC-托业考试 托业考试由美国教育考试服务中心(ETS)开…

每日涨停个股增量加入股票池,持续跟踪走势!股票量化分析工具QTYX-V2.6.5

功能概述 目前A股市场的股票每天是有限制最大涨幅的,也就是涨停的概念。比如主板个股最大涨幅是10%,创业板个股最大涨幅是20%等。 对于个股而言并不是随随便便就能被推到涨停板的。或是因为股票发生了重大的利好(资产重组、政策利好、业绩暴增…

通达信筹码循环指标源码 显示吸筹拉升出货的过程

出现双红带时买入 源代码: VUR1:(CAPITAL*(2*(OL)/2(HC)/2L3*(CL)/2)/7); VUR2:(SMA(AMOUNT,8,1)/1000); VUR3:EMA((CL)/2*3,3); VUR4:(VUR2*(CL)/2*3/VUR3)/10; VUR5:(VUR2*(OL)/2*3/VUR3)/10; VUR6:(VUR2*(HC)/2*3/VUR3)/10; VUR7:(VUR2*L*3/VUR3)/10; VU…

A股全市场个股涨停板明细来袭!—股票数据远程下载服务升级

前言 创建知识星球《玩转股票量化交易》的初心是为了建立一个可以深入学习和交流的私有量化圈子,和志同道合的小伙伴们一起搭建私有的量化交易系统,并且不断迭代完善这个系统,从而能够帮助我们更高效地分析股票、获得更大的盈利机会。 关于星…

从同花顺获取涨停数据,视图化分析优质板,方便投资。

同花顺每日涨停数据获取 视图化分析优质板 import pandas as pd import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt from matplotlib.widgets import MultiCursor mpl.rcParams[font.sans-serif][SimHei] #导入数据 df pd.read_excel(rE:\同花顺…

vue2和elementUI 打造落日余晖登录页和滑块校验

文章目录 前言1 项目搭建2 依赖引入3 项目调整①vue-router② App.vue③ main.js 4 写登录页5 写滑块校验6 源码下载7 问题解决①项目一直报错② 背景图存在白边 前言 标题很夸张,实则是AI的功能,今天咱也搞一个登录页,其实满简单的一个东东…

问卷星录入过程参考

前面讲过的那些这里就不在重复了。直接从录入数据开始讲起, 这里我正好在录入一个问卷内容,以此为例来说一下 因为我首先要录入的是单选题,所以先点击单选添加单选题。 我录入的问题 其他题目的操作都与此类似,可供参考,希望能解决你的疑惑。…

python自动化------问卷星刷问卷3.0版本

接上,之前做的问卷星刷问卷的功能单一,每个题目只能选一个选项。现在的3.0版本功能增加了计数器(刷了几份问卷)、多选项的选择、通过滑块验证。想要了解之前的相关信息请看下面的链接: 隔壁寝室刷问卷刷疯了&#xff…

如何愉快的填写问卷星

从业务开发,了解http本质。 问卷星代刷方法: pythonselenium 通过自动化测试工具正常填写,方法低效,容易出现安全检测(本文不讲)。post请求,模拟包发送,简单快捷,跳过安全检测&…