论文阅读 - Hidden messages: mapping nations’ media campaigns

论文链接:

https://link.springer.com/content/pdf/10.1007/s10588-023-09382-7.pdf

目录

1 Introduction

2 The influence model

2.1 The influence‑model library

 3 Data

4 Methodology

4.1 Constructing observations

4.2 Learning the state‑transition matrices

5 Results

5.1 Account clusters

5.2 Coordinated link sharing

5.3 Top influencer

5.4 State‑linked tweet activity

6 Discussion

7 Conclusion


        几个世纪以来,有权势的行为者一直在进行信息控制,限制、促进或影响信息环境,以适应其不断发展的机构。在数字时代,信息控制已经转移到了网上,信息行动现在瞄准了在新闻参与和公民辩论中发挥关键作用的网络平台。在本文中,我们使用离散时间随机模型来分析在线社交网络中的协调活动,将账户行为表示为相互作用的马尔可夫链

        我们从 206 个账户(其中一半被 Twitter 识别为参与了与国家有关的信息行动)发布的 31521 条推文的数据集中,评估了与国家有关的账户对与未与国家有关的账户对之间的协调性(以表面影响力衡量)。我们的分析表明,与国家有关的行动者之间的协调程度明显高于他们与无关联账户之间的协调程度。此外,与国家有关的账户之间的协调程度是无关联账户之间的七倍多。此外,我们还发现,在网络中代表最协调活动的账户没有追随者,这证明了我们的建模方法即使在没有显性网络结构的情况下也能发现隐藏连接的能力

1 Introduction

        网络媒体的消费率急剧上升,个人的在线社交网络(OSN)成为越来越受欢迎的新闻内容来源。希望操纵信息环境的国家和非国家行为体顺应了这一趋势,针对一系列在线平台发起了信息行动。自 2018 年 10 月以来,Twitter 已公开确认了 40 多起与国家有关的信息行动,这些行动被归咎于 20 多个国家,以其平台 Twittter 为目标(2022 年)。从 2017 年到 2021 年年中,Facebook 也同样删除并报告了来自 50 多个国家的 150 多起信息行动 Facebook(2021)。信息行动的特点可以概括为以战略目标为目的、从根本上具有欺骗性的协调活动(Erhardt 和 Pentland,2021 年)。这种欺骗不一定意味着明确的虚假信息(如断章取义的图片、议程设置,或在信息环境中充斥多余的信息以混淆视听(Starbird 等人,2019 年;King 等人,2017 年))。

        错误/虚假信息领域的大部分文献都侧重于通过基于内容的特征(Alizadeh 等人,2020 年;Rheault 和 Musulan,2021 年)或基于网络的方法(Vargas 等人,2020 年)来检测信息操作。其他研究则研究了帖子活动的时间模式(Luceri 等人,2020 年;Magelinski 和 Carley,2020 年)。在本文中,我们选择重新审视影响模型,该模型最早由 Asavathiratham(2001 年)提出。该模型与 Magelinski 和 Carley(2020 年)中的时间方法最为相似,但其优势在于能够区分明显影响的方向性,而不是产生一个无向的账户对账户协调图。影响模型描述了网络化、相互作用的马尔可夫链的动态。马尔科夫链是一种生成随机变量序列的方法,其中当前值在概率上总是只依赖于最近的前一个值

        在这种情况下,我们选择将单个社交账户建模为马尔可夫链,其随机变量代表特定用户的帖子活动。利用影响力模型,我们可以仅根据帖子活动来衡量成对账户之间的协调性。从这些协调度量中,我们可以量化账户之间的隐藏联系以及潜在的不真实活动。我们关注信息操作的协调性有几个原因。首先,它减轻了与审核相关的一些隐私和偏见问题。其次,与基于内容的替代方法相比,影响建模方法更不依赖于语言和媒体。第三,与基于网络的方法不同,这种方法不需要访问底层网络结构。

        我们的贡献如下。首先,我们提出了一种新颖的影响模型应用,用于检测参与信息操作的账户。其次,我们展示了如何仅凭协调的发帖活动就能将网络中的状态链接账户与其他账户区分开来。第三,我们发布了一个开源 Python 库,它能有效地实现影响模型,并支持从观测序列中学习其参数。该程序包可在 https:// pypi. org/ proje ct/ influ ence- model/ 上获取。

2 The influence model

        影响模型通过马尔可夫链之间的 "影响 "来描述网络马尔可夫链之间的关系。该模型由相互作用的马尔可夫链网络组成,每个马尔可夫链与网络中的一个节点相关联。在网络层面,节点被称为站点,它们之间的联系由随机网络矩阵 D 描述。在局部层面上,每个站点都有一个内部马尔可夫链 Γ(A),并在任何给定的离散时间瞬间处于 Γ(A)的状态之一。这些状态由一个长度为 m 的状态向量 ⃗ s 表示,这个指示向量在与当前状态相对应的位置上包含一个 1,在其他位置上包含 0:

         每条链都会根据自身及其邻链的状态进行演变。影响模型中第 i 个站点的状态更新分为三个阶段:

        (1)第 i 个站点(sitei)随机选择一个邻居作为其确定站点;站点 j 被选中的概率为 d_ij;

        (2)站点 j 在时间 k 的状态⃗\vec{s_j}[k],固定了概率向量\vec{p_i}[k+1],该向量在用于 (3) 中去随机选择site i 的下一个状态。

        (3)下一个状态 ⃗\vec{s_i}[k+1]根据\vec{p_i}[k+1]实现。

        状态转换矩阵 Aij 描述了站点 j 的状态转换概率如何取决于站点 i 以前的状态。Aij 是 mi × mj 的非负矩阵,各行总和为 1。A 是一个矩阵,Aij 位于其(i,j)块中。根据随机网络矩阵 D 和状态转换矩阵 A,可以计算出影响矩阵 H,该矩阵描述了网络中每个站点施加的 "影响"。H 表示影响模型中各站点组的联合状态,由 D' 和 {Aij} 的广义克朗克乘积给出。

         影响模型已被应用于许多问题,从模拟电网故障到识别会议中的职能角色(Asavathi-ratham 等人,2001 年;Dong 等人,2007 年)。有关该模型及其特性和应用的更多详情,请读者参阅 Asavathiratham 等人 (2001) 和 Pan 等人 (2012)。

2.1 The influence‑model library

        在发表这篇论文的同时,我们还发布了一个开源 Python 库,提供了影响模型的完整实现。该库支持定义新的影响模型,并通过应用模型的演化方程生成观测结果。它还提供了重建从一连串的观测数据中建立影响模型,学习参数 D、A 和 H。Basu 等人(2001 年)提出的joy示例演示了这一实现方法:

 3 Data

        在本文中,我们分析了一次针对推特、归属于中华人民共和国(PRC)的信息行动。该行动的重点是宣传中国共产党(CCP)有关新疆维族人待遇的言论。2021 年 12 月,推特公布了与这一与国家有关的信息行动相关的具有代表性的样本账户和推文,其中包括来自 2016 个独特账户的 31269 条推文。这些推文从 2019 年 4 月 20 日开始,到 2021 年 4 月 5 日结束。我们用 "无关联 "账户和推文扩充了这一数据集,"非关联 "账户和推文是指截至 2022 年 3 月推特平台上仍可用的账户和推文(未因涉嫌信息行动或其他平台违规而被删除)。非关联账户的推文是通过 Twitter Search API v2 收集的,选择在 2019 年 4 月 20 日至 2021 年 4 月 5 日期间发布的推文,其中至少包含一个关键词或标签(不区分大小写): "新疆"、"维吾尔族"、"维吾尔人"、"维吾尔人"、"维吾尔人"、"维吾尔人"、"维吾尔人"、"维吾尔人 "或 "维吾尔人"。该搜索查询共返回来自 2,665,001 个独特账户的 14,728,582 条推文。

        为确保每个账户都有合理数量的观察结果(推文),我们只考虑推文总数排名前百分之一的账户的推文。这意味着一个账户必须在两年内至少发布 60 次推文才能被纳入分析。在对推文进行精选后,我们只剩下 103 个与国家有关的账户发布的 10,889 条推文和 27,003 个无关联账户发布的 6,231,955 条推文。然后,我们随机选择 103 个账户(相当于与国家有关的账户数量)及其相关推文进行分析。我们的最终数据集包括来自 206 个账户(50% 与国家有关,50% 无关联)的 31521 条推文

4 Methodology

        我们数据集中的每个账户都是网络图中的一个站点。两类账户(与国家有关联的账户和非关联账户)以及真实的网络结构(关注者与关注者之间的关系)并不是先验已知的。我们的目标是利用观察到的行为,量化决定每个站点在网络中地位的 "影响力"

4.1 Constructing observations

        站点通过发布信息(tweets)进行互动,这是我们观察到的行为。如果一个网站在离散时间瞬间 k 发布了一条信息,我们就认为该网站在时间 k 处于 "活跃 "状态。我们选择将推文划分为 1 小时的时间块,以确保有足够的粒度将明确协调的行为与开始流行的话题区分开来,同时还能确保在任何给定时间都有一定数量的账户可能处于 "活跃 "状态。每个账号的观察序列代表了该账号在一段时间内的状态。

        考虑到我们期望协调的行动者会共同推动类似的叙述,我们对整体帖子活动的兴趣较小,而对按主题划分的帖子活动更感兴趣。我们为 "话题 "选择了一个简单的定义:任何实体都是一个话题。每条信息都包含零个或多个实体,定义为标签、URL 或用户提及。我们首先从帖子中提取所有实体,然后为每个实体构建跨所有站点的观察序列

        . 例如,对于实体 #hashtag,我们只需要如果账户发布了包含 #hashtag 的信息,则认为该账户为活跃账户。我们排除了从 Twitter API 收集账户时用作搜索条件的任何实体。此外,我们还对 URL 进行了规范化处理,删除了协议、子域和任何查询参数

4.2 Learning the state‑transition matrices

        在影响模型中,每个站点的状态会随着时间的推移而变化,这取决于网络中其他站点的 "影响"。这种影响部分由前面提到的状态转换矩阵表示。给定每个观测点的观测序列,我们就可以使用与 Basu 等人(2001)的方法类似的最大似然估计法重建状态转换矩阵。每个状态转换矩阵为 2 × 2,代表两种可能的状态:活跃和不活跃。如果站点 j 完全遵循站点 i 的行为(正向协调),那么 Aij 就是单位矩阵。为了得到每个状态转换矩阵的标量协调度量,我们计算 Aij 与单位矩阵的弗罗贝尼斯内积。协调度的范围为 [0,2]。0 代表最大正协调,即 site_i[k - 1] = site_j[k] ∀ k;2 代表最大负协调,即 site_i[k - 1] ≠ site_j[k] ∀ k。通过对所有节点的这些协调度量取平均值,我们可以确定每对节点的主状态-状态转移矩阵。

5 Results

        我们发现,参与最协调活动的账户绝大多数是由与国家相关的行为体控制的账户。此外,我们发现,通过对更传统的关注者关注关系网络(即使可用)的分析,无法识别协调网络中心的帐户,因为这些帐户几乎没有关注者。

5.1 Account clusters

        为了评估协调活动水平较高的账户群,我们根据成对的协调度量构建了一个协调网络。协调网络中的有向边 (i, j) 代表站点 i 对站点 j 有明显的影响,边的权重等于 1 减去协调度。我们主要关注的是正向协调--当一个账户模仿另一个账户的行为时,因此只有当协调度小于 1 时才会创建一条边(回顾一下,0 相当于最大正向协调)。这种筛选意味着并非所有账户都会出现在协调网络中。如果一个账户不能对另一个账户产生积极的 "影响",而其本身也没有受到积极的 "影响",那么这个账户就不存在。我们发现,协调程度高的账户群主要由与国家有关的行动者控制,每个账户群通常由所有与国家有关或所有无关联的账户组成。这与我们的直觉相吻合,即账户会根据其类别成员身份,在与之协调的账户中表现出明显的差异。

        如表 1 所示,当我们单独研究这三种实体类型时,会发现它们的协调方式有所不同。在所有情况下,与国家有关的账户在参与协调活动的账户中占大多数,并且几乎只与其他与国家有关的账户进行协调。无关联账户在网络中最多的表现形式是URL共享,这可能是由于新出现的新闻报道在OSN中传播的速度很快。

5.2 Coordinated link sharing

        在与国家有关的账户中,中国官方国家新闻机构新华社的一篇英文文章显示了最协调的活动。这篇报道谴责了美国因新疆涉嫌侵犯人权而实施的制裁。对于没有关联的账户,香港传媒摄影协会有限公司(PSHK Media)在Facebook上发布的一篇中文帖子描述了中共官员对新疆维吾尔人的“中国化”,显示出了最大的协调。帖子指责中共官员胁迫穆斯林少数民族庆祝中国传统节日并食用猪肉。有趣的是,Facebook 屏蔽了其平台上指向 PSHK Media 网站的重定向,而且截至本文撰写之时,该网站似乎已被其托管服务提供商暂停服务。

5.3 Top influencer

        通过对标签、URL 和用户提及协调网络进行平均,得出了一个由 81 个账户组成的新网络,其中 75 个与国家有关,6 个与国家无关。在这个网络中,我们发现有一个账户的协调程度远远高于其他账户。这个 "顶级影响者 "与国家有关,并且只与其他与国家有关的账户协调。有趣的是,这个账户没有关注任何其他用户,也没有追随者。

        在长达两年的中国信息行动中,该账户共发布了 87 条推文。59 条推文包含一个标签,其中最受欢迎的是 "新疆"、"新疆在线 "和 "停止新疆谣言"。28 条推文包含网址,除了中国共产党的官方报纸《人民日报》外,还引用了中国政府拥有的 8 家新闻或信息网站的报道。71 条用户推文包含用户提及。这些推文既有反驳国家强制绝育和新疆强迫劳动的争论性推文,也有描述新疆人民幸福、和平、富足生活的乐观推文。在活动开始时,该账号往往是最先开始分享新内容的账号之一,例如,一个以前未分享过的 URL,随后被其他与国家有关的账号转载,从而提高了其影响力分数。

5.4 State‑linked tweet activity

        2021 年 1 月 19 日,迈克-蓬佩奥(Mike Pompeo)作为美国国务卿上任的最后一天,发表了一份新闻声明,指责中国对新疆维吾尔族人实施了 "持续的 "种族灭绝。该声明似乎引发了与国家有关的账户推特活动的急剧上升,其中许多推文直接提到了蓬佩奥。为了评估推文的活跃程度是否会对我们研究的协调度产生影响,我们计算了与图 1 相同的网络,这次我们将推文细分为两组:2021 年 1 月 19 日之前发布的推文(低活跃期)和之后发布的推文(高活跃期)。结果与整个两年期间观察到的结果保持一致。然而,蓬佩奥公开声明后,当国家相关推文活动达到顶峰时,国家相关账户之间的协调措施就更加明显。平均而言,协调得分显示标签网络增加了 4.36 倍,URL 网络增加了 1.47 倍,用户提及网络增加了 2.09 倍(图 2)。

(图 1 账户之间的协调。如果一条边代表了一个与国家有关的账户和另一个与国家有关的账户之间的协调活动,则该边用黄色表示;如果协调活动是从一个无关联账户到一个无关联账户,则该边用蓝色表示;如果该边连接了不同类别的账户,则该边用灰色表示。节点的大小按账户施加的总 "影响力 "缩放。网络采用 Fruchterman-Reingold 布局,使相邻节点物理上相互靠近。(在线彩图))

 

 

6 Discussion

         分析网络动态似乎有望成为一种检测机制用于发现操作系统网络上的明确策划活动。在本文中,我们使用影响力模型来描述参与讨论维吾尔族和/或新疆(中国西北部维吾尔族聚居的自治区)的账号之间的关系。我们希望在更大范围的信息运营数据集上进行同样的分析。Twitter 已经发布了数十个数据集,其中包含来自 40 多个国家相关信息业务的账户和推文。我们很想知道我们的模型在这些范围广泛的活动中表现如何。

        此外,我们还计划探索如何以新的方式使用最新的统计方法来揭示协调活动的网络动力学。例如,非线性 "因果 "分析和子图检测研究最近取得了进展(Wang 等,2018 年)。与本文提出的方法类似,帖子活动被视为一种观察到的行为帖子行为等动态特征可能会被证明有助于检测隐藏的子图,如状态关联行为者网络。

7 Conclusion

        我们相信,这项工作是检测协调信息操作的一种独特方法,它植根于一个经过充分研究的模型,具有广泛的实用性。我们展示了所提出的方法如何在无法访问用户信息、帖子内容或底层网络结构的情况下,成功地将参与真实世界信息操作的状态关联账户与非关联 Twitter 用户区分开来。仅考虑网络动态,就有可能减轻因 OSN 上的内容审核而产生的潜在隐私和偏见问题。此外,网络动态还能揭示隐藏在协调的不真实活动背后的影响,而这些影响大多无法从标准的网络社会影响力衡量标准中辨别出来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/175944.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

040-第三代软件开发-全新波形抓取算法

第三代软件开发-全新波形抓取算法 文章目录 第三代软件开发-全新波形抓取算法项目介绍全新波形抓取算法代码小解 关键字: Qt、 Qml、 抓波、 截获、 波形 项目介绍 欢迎来到我们的 QML & C 项目!这个项目结合了 QML(Qt Meta-Object …

vue3+jsx+antd的插槽写法之一

如果在jsx里面直接这样按照官方的写法是会报错的 正确写法是:

Azure - 自动化机器学习AutoML Azure使用详解

目录 一、AutoML是如何工作的?二、何时考虑AutoML?三、AutoML助力训练与集成过程四、实战案例五、总结 自动化机器学习,简称为AutoML,旨在将机器学习模型的开发中繁琐且重复的任务自动化。这使得数据科学家、分析师以及开发人员能…

stable-diffusion-webui环境部署

stable-diffusion-webui环境部署 1. 环境创建2. 安装依赖库3.下载底模4. 获取lora参数文件5.运行代码6. 报错信息报错1报错2 1. 环境创建 创建虚拟环境 conda create -n env_stable python3.10.0进入虚拟环境 conda activate env_stableclone源码 git clone https://github.com…

力扣 三数之和 双指针 java

Problem: 15. 三数之和 时间复杂度: O ( n 2 ) O(n^2) O(n2) &#x1f351; AC code class Solution {public List<List<Integer>> threeSum(int[] nums) {List<List<Integer>> res new ArrayList<>();int len nums.length; if(len < 3…

如何在【逻辑回归】中优化控制正则化程度的超参数C

一.逻辑回归基本介绍 逻辑回归也称作logistic回归&#xff0c;是一种广义的线性回归分析模型&#xff0c;主要是用来解决二分类问题&#xff08;也可以解决多分类问题&#xff09;。通过训练集来训练模型&#xff0c;并在训练结束后对测试集进行分类。 通过激活函数&…

MATLAB R2018b详细安装教程(附资源)

云盘链接&#xff1a; pan.baidu.com/s/1SsfNtlG96umfXdhaEOPT1g 提取码&#xff1a;1024 大小&#xff1a;11.77GB 安装环境&#xff1a;Win10/Win8/Win7 安装步骤&#xff1a; 1.鼠标右击【R2018b(64bit)】压缩包选择【解压到 R2018b(64bit)】 2.打开解压后的文件夹中的…

轧钢测径仪在螺纹钢负公差轧制中的四大作用!

螺纹钢为什么要进行负公差轧制&#xff1f; 在标准允许范围内&#xff0c;越接近负公差&#xff0c;那么在合格规范内&#xff0c;所损耗的原材料越少&#xff0c;而螺纹钢轧制速度快&#xff0c;更是以吨的量进行成交&#xff0c;因此控制的原材料积少成多&#xff0c;对其成本…

数字展厅搭建平台要具备哪些功能,如何选择数字展厅搭建平台

引言: 数字展厅搭建平什台是现代营销中不可或缺的重要工具之一。它可以帮助企业打造个性化、多媒体、互动性强的展示空间&#xff0c;吸引、引导和留住目标用户。在选择数字展厅搭建平台时&#xff0c;我们需要考虑各方面的功能和性能&#xff0c;以确保能够满足企业的需求并取…

三十九、CANdelaStudio实践-19服务(ReadDTCInformation)

本专栏将由浅入深的展开诊断实际开发与测试的数据库编辑,包含大量实际开发过程中的步骤、使用技巧与少量对Autosar标准的解读。希望能对大家有所帮助,与大家共同成长,早日成为一名车载诊断、通信全栈工程师。 本文介绍CANdelaStudio的19服务(ReadDTCInformation)编辑,欢迎…

【k8s】5、资源管理命令-声明式

目录 一、 yaml和json介绍 1、yuml语言介绍 2、k8s支持的文件格式 3、yaml和json的主要区别 二、声明式对象管理 1、命令式对象配置 2、声明式对象配置 3、声明式对象管理命令介绍 三、编写资源配置清单 1、 编写yaml文件 2、 启动并查看资源 3、创建service服务对外…

知识付费系统的技术架构和设计原则

知识付费系统的成功取决于其坚实的技术架构和设计原则。本文将探讨创建一个高效、可扩展和安全的知识付费系统所需的技术要素和设计原则&#xff0c;并提供一些示例代码&#xff0c;以帮助您开始构建自己的系统。 技术架构 1. 后端服务 知识付费系统的后端服务是其核心组成部分…

堆排序 详解+图解

堆排序是一种基于堆数据结构的排序算法&#xff0c;它的基本思想是将待排序序列构造成一个最大堆&#xff0c;然后将堆顶元素和堆底元素交换&#xff0c;再把堆的大小减一&#xff0c;使堆顶元素下沉到合适的位置&#xff0c;重复以上操作&#xff0c;直到整个序列有序。 堆排…

Python的错误和异常处理

一、错误和异常 编程中出现的错误大致可以分为两类&#xff1a;错误和异常。 (一)错误 错误又可以分为两类&#xff1a;语法错误和逻辑错误。 1. 语法错误 语法错误又称解析错误&#xff0c;它是指在编写程序时&#xff0c;程序的语法不符合Python语言的规范&#xff0c;导致…

【Python百练——第2练】使用Python做一个猜数字小游戏

&#x1f490;作者&#xff1a;insist-- &#x1f490;个人主页&#xff1a;insist-- 的个人主页 理想主义的花&#xff0c;最终会盛开在浪漫主义的土壤里&#xff0c;我们的热情永远不会熄灭&#xff0c;在现实平凡中&#xff0c;我们终将上岸&#xff0c;阳光万里 ❤️欢迎点…

Pycharm 搭建 Django 项目,看完这一篇就够了

1. 安装需求 在使用 python 框架 Django 需要注意下面事项 Pycharm 版本是专业版而不是社区版本Pycharm 配置好了 python 解释器 &#xff08;一般我们现在用的都是python3&#xff09;我自己使用的是 Pycharm 版本是2020.1.2 2. 准备工作 2.1 新建项目 首先我们打开 Pycharm …

超融合数据库:解锁全场景数据价值的钥匙

前言 近日&#xff0c;四维纵横对外官宣已完成上亿元 B 轮融资。作为超融合数据库理念的提出者&#xff0c;三年来 YMatrix 持续在超融合数据库领域中保持精进与迭代&#xff0c;对于超融合数据库在行业、场景中的应用和理解也更为深刻。 本篇文章&#xff0c;我们将基于 YMa…

【Linux】常见指令以及具体其使用场景

君兮_的个人主页 即使走的再远&#xff0c;也勿忘启程时的初心 C/C 游戏开发 Hello,米娜桑们&#xff0c;这里是君兮_&#xff0c;随着博主的学习&#xff0c;博主掌握的技能也越来越多&#xff0c;今天又根据最近的学习开设一个新的专栏——Linux&#xff0c;相信Linux操作系…

window11最新版终于可以取消任务栏合并了

windows11一个软件开了多个窗口之后&#xff0c;会自动合并任务栏&#xff0c;很不方便选择其中一个窗口&#xff0c;且没有选项能关闭这一配置 今日发现&#xff0c;最新版完善了这一功能&#xff0c;现在可以关闭自动合并任务栏了 右击任务栏&#xff0c;选择任务栏设置选择…

element表格自定义筛选

文章目录 前言一、简介二、效果展示三、源码总结 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; …待续 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 一、简介 修改el-table的筛选…待续 二、效果展示 三、源码 使用方法…