论文阅读:Most Probable Densest Subgraphs

摘要

本文提出了一种在不确定图中发现最有可能稠密子图(MPDS)的新方法。不确定图中的每条边都有存在概率,使得计算稠密子图变得複杂。作者定义了稠密子图概率,并证明了计算该概率是#P难的。为了解决这个问题,设计了基于抽样的高效近似算法,并提供了准确性保证。实验结果表明,该方法在生物、社交和金融网络中的应用中具有高效性和实用性。

研究背景

在数据管理和网络分析领域,稠密子图的发现一直是重要的研究问题。稠密子图在各种应用中具有重要意义,如社交网络中的社区检测、生物网络中的功能模块识别,以及金融网络中的欺诈检测等。然而,现实世界中的数据往往具有不确定性,例如由于测量误差或数据隐私原因,图中的边可能不确定。这种不确定性使得传统的稠密子图发现方法在应用中面临挑战。因此,研究如何在不确定图中有效地发现稠密子图成为了一个重要课题。

研究问题

本文研究的核心问题是在不确定图中找到最有可能生成稠密子图的节点集。具体而言,给定一个不确定图,每条边都有一定的存在概率,目标是找出一个节点集,使得这些节点在所有可能的确定性图中生成稠密子图的概率最大。这个问题被定义为“最有可能的稠密子图问题”(MPDS)。

在这里插入图片描述

主要贡献

  1. 新问题定义:引入了稠密子图概率的概念,并证明了计算该概率是#P难的。这一创新为稠密子图问题提供了新的视角和解决方案。
  2. 高效近似算法:设计了基于抽样的近似算法,用于计算MPDS,并提供了端到端的准确性保证。这些算法能够在合理的时间内处理大规模不确定图,并给出准确的近似结果。
  3. 实验验证:通过在多个真实世界数据集上的实验,展示了所提出方法的有效性和实用性。实验结果表明,该方法在生物、社交和金融网络中的应用中具有显着优势。

方法

问题建模

在不确定图中,每条边都有一个存在概率。本文首先将这一模型形式化,并定义了稠密子图概率,表示某个节点集在所有可能的确定性图中生成稠密子图的总概率。

在这里插入图片描述

抽样技术

为了计算稠密子图概率,作者使用了蒙特卡罗抽样方法生成多个可能的确定性图(可能世界)。每个确定性图都是根据不确定图中的边存在概率独立生成的。

稠密子图检测

在每个抽样的确定性图中,使用现有的稠密子图检测算法,如基于最大流的Goldberg算法,找到所有的稠密子图。这些结果被累积起来,用于估计每个节点集生成稠密子图的概率。

为了更好地理解这一过程,我们以3-clique稠密子图检测为例,展示如何在确定性图中进行该检测。

在这里插入图片描述

解释如下:

输入图 (a):一个包含6个节点和若干边的输入不确定图。

确定性实例 (b):从不确定图中抽样得到的一个确定性图实例。

流网络 ©:为了找出3-clique稠密子图,构建了一个对应的流网络。

所有 (h-1) clique (d):在确定性图中找到所有的2-clique,作为后续流网络构建的基础。

残差图 (e):在最大流计算后得到的残差图,通过残差图可以识别出所有的3-clique稠密子图。

这一示例展示了从不确定图到确定性图,再到流网络和残差图的转变过程,并说明了如何利用这些工具来识别稠密子图。

结果排序

根据计算出的稠密子图概率,将节点集进行排序,找出top-k最有可能生成稠密子图的节点集。这些节点集即为所谓的“最有可能的稠密子图”。

实验与结果

实验设计

为了验证所提出方法的有效性,作者在多个真实世界数据集上进行了实验,包括脑网络、社交网络和金融网络。这些数据集具有不同的规模和特性,能够全面测试算法的性能。

结果分析

实验结果表明,所提出的方法在计算效率和结果准确性方面均优于现有方法。具体来说,所提出的基于抽样的算法能够在合理的时间内处理大规模不确定图,并提供高准确性的近似结果。此外,这些结果在不同应用场景中均显示出良好的适应性。

案例研究

脑网络

在脑网络的实验中,研究人员应用了所提出的方法来分析不同脑区之间的连接模式。实验结果成功区分了健康脑与自闭症脑,展示了该方法在生物医学领域的潜力。具体来说,该方法能够识别出自闭症患者脑中的异常连接模式,这些异常连接可能与自闭症的病理机制相关,为临床诊断和治疗提供了新的线索。

在这里插入图片描述

图8展示了在脑网络中3-clique MPDS的节点集,对比了典型发育的脑与受自闭症影响的脑。彩色边界表示小脑、枕叶和颞叶的位置。左图显示了在典型发育的脑中3-clique MPDS的节点集,右图显示了在受自闭症影响的脑中3-clique MPDS的节点集。这张图对比了不同脑区中的稠密子图结构,有助于理解自闭症对脑网络结构的影响。

在这里插入图片描述

图9展示了在脑网络中3-clique MPDS的节点集,并对比了典型发育的脑与受自闭症影响的脑。图中每条边的粗细与其概率成正比。这进一步直观地展示了脑网络中节点之间的连接强度及其分布情况,为理解自闭症对脑网络结构的影响提供了视觉化的辅助工具。

结论

本文提出了一种新方法来解决不确定图中的稠密子图问题。通过基于抽样的高效近似算法,该方法能够在处理大规模不确定图时提供准确的近似结果,并在多个应用领域中展示了其有效性和实用性。这一研究为不确定图的分析提供了新的工具和方法,对未来的研究和应用具有重要意义。之後的研究可以进一步优化算法,降低计算成本,并探索更多不同类型的不确定图模型和应用场景。此外,可以将所提出的方法扩展到动态图和加权图等更複杂的图模型中,以应对更加多样化的实际应用需求。

论文地址:https://arxiv.org/abs/2212.08820

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/390335.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据科学 - 数据预处理 (数据清洗,结构化数据)

1. 前言 数据清洗与结构化数据在数据分析和机器学习项目中扮演着至关重要的角色。随着大数据时代的到来,数据的质量、准确性和可用性成为决定项目成功与否的关键因素。 数据清洗提高数据质量,保证数据集的一致性;促进数据分析与挖掘&#xf…

【大数据开发语言Scala的入门教程】

🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步! 🪁Scala 🪡Scala是一种功能丰富且具有强大表达能力的静态类型…

【2024蓝桥杯/C++/B组/传送阵】

题目 问题代码 #include<bits/stdc.h> using namespace std;const int N 1e610; int n; int porter[N]; int ans; int sign[N]; bool used;void dfs(int now, int cnt) {if(sign[now] && used){ans max(ans, cnt);return;}if(!sign[now]){cnt, sign[now] 1; …

成为git砖家(8): 使用 git log 查询范围内的 commit

文章目录 1. 查询 git log 的文档2. 不带任何参数: git log 啥意思&#xff1f;3. git log 最主要功能是什么&#xff1f;4. git log <commit1>..<commit2> 什么意思5. 查看最近n次commit6. References 1. 查询 git log 的文档 git help log --web市面上针对 git …

ubuntu sudo命令不需要密码

sudo vim /etc/sudoers1、注释掉 %sudo ALL(ALL:ALL) AL 2、添加 用户名 ALL(ALL:ALL) NOPASSWD:ALL保存&#xff0c;退出即可

NineData云原生智能数据管理平台新功能发布|2024年7月版

本月发布 12 项更新&#xff0c;其中性能优化 3 项、功能优化 8 项、安全性发布 1 项。 1. 性能优化 数据复制 - SQL Server 增量性能优化 调整读取和写入方式&#xff0c;让 SQL Server 增量复制的性能轻松达到 5000 RPS 以上。 数据复制 - Doris|SelectDB|StarRocks 性能优…

链式二叉树的实现

文章目录 &#x1f3af;引言&#x1f453;链式二叉树的实现1.链式二叉树的结构2.链式二叉树相关操作实现2.1源码展示2.2函数实现详解2.2.1前中后序遍历2.2.2二叉树的其他方法实现2.2.3二叉树的层序遍历和判断是否是完全二叉树 &#x1f947;结语 &#x1f3af;引言 欢迎来到Ha…

【多模态大模型】 BLIP-2 in ICML 2023

一、引言 论文&#xff1a; BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models 作者&#xff1a; Salesforce Research 代码&#xff1a; BLIP-2 特点&#xff1a; 该方法分别使用冻结的图像编码器&#xff08;ViT-L/…

全球氢钎焊市场规划预测:未来六年CAGR为3.4%

随着全球制造业的持续发展和消费者对高质量产品的需求增加&#xff0c;氢钎焊作为一种高效的焊接技术&#xff0c;正逐渐受到市场的广泛关注。本文旨在通过深度分析氢钎焊行业的各个维度&#xff0c;揭示行业发展趋势和潜在机会。 【市场趋势的演变】 1. 市场规模与增长&#…

C++自定义接口类设计器之可对称赋值三

关键代码 QStringList newLines;for (const auto& line : lines) {auto equalIndex line.indexOf("");if(-1 ! equalIndex) {// a b; 赋值auto var line.mid(0, equalIndex).trimmed();auto value line.mid(equalIndex 1).trimmed();if(value.endsWith(&quo…

【网络安全】副业兼职日入12k,网安人不接私活就太可惜了!

暑假来了&#xff0c;很多同学后台私信我求做兼职的路子&#xff0c;这里&#xff0c;我整理了一份详细攻略&#xff0c;请大家务必查收&#xff0c;这可能会帮你把几个学期的生活费都赚够&#xff01; Up刚工作就开始做挖漏洞兼职&#xff0c;最高一次赚了12k&#xff0c;后面…

STM32Cubemx在FreeRTOS中使用面向对象的方式使用串口

文章目录 前言一、创建FreeRTOS工程二、创建文件对串口进行封装三、代码编写总结 前言 本篇文章将带大家来学习使用面向对象的方式在FreeRTOS中使用串口&#xff0c;使用面向对象的方法非常适合编写可移植性强的代码&#xff0c;那么这篇文章就带大家来看一下这个代码要怎么写…

模型 正态分布(通俗解读)

系列文章 分享 模型&#xff0c;了解更多&#x1f449; 模型_思维模型目录。随机世界的规律&#xff0c;大自然里的钟形曲线。 1 正态分布的应用 1.1 质量管理之六西格玛 六西格玛是一种旨在通过识别和消除缺陷原因来提高制造过程或业务流程质量的管理策略。我们先来了解下六…

CX32L003F8P6T芯片解密程序破解

CX32L003F8P6T可替代N76E003 CX32L003是一款内嵌32位ARM Cortex-M0内核的超低功耗、Low Pin Count和宽电压工作范围(2.5V~5.5V)的微控制器&#xff0c;最高可运行在24MHz&#xff0c;内置32K/64K字节的嵌入式Flash&#xff0c;4K字节的SRAM&#xff0c;集成了12位1Msps高精度SA…

C++ 初探(13课)

#include<iostream> using namespace std; int main() {cout<<"Helloworld"<<endl; } 函数:一段能够被反复调用的代码,可以接收输入,进行并行处理或者产生输出; ——返回类型:表示函数返回结果的类型,可以为void ——函数名称:用于函数的…

【JAVA设计模式】适配器模式——类适配器模式详解与案例分析

前言 在软件设计中&#xff0c;适配器模式&#xff08;Adapter Pattern&#xff09;是一种结构型设计模式&#xff0c;旨在使不兼容的接口能够协同工作。它通过引入一个适配器类&#xff0c;帮助两个接口之间进行适配&#xff0c;使得它们能够互相操作。本文将详细介绍适配器模…

大学生编程入门指南:如何从零开始?

人不走空 &#x1f308;个人主页&#xff1a;人不走空 &#x1f496;系列专栏&#xff1a;算法专题 ⏰诗词歌赋&#xff1a;斯是陋室&#xff0c;惟吾德馨 目录 编程语言选择 &#x1f4da; 1. Python 2. JavaScript 3. Java 4. C/C 如何选择适合自己的编程语言&a…

vim列编辑模式

在编辑文本时&#xff0c;经常会有这样的需求&#xff0c;对特定列进行进行批量编辑。比如批量注释一段代码&#xff0c;或者删除待定字符&#xff08;如一列空格&#xff09;。幸运的是VIM支持列编辑模式。 假设文本内容&#xff1a; Maximum length of a custom vocabulary…

svm总结

什么是SVM&#xff1f; SVM的英文全称是Support Vector Machines&#xff0c;我们叫它支持向量机。支持向量机是我们用于分类的一种算法。让我们以一个小故事的形式&#xff0c;开启我们的SVM之旅吧。 在很久以前的情人节&#xff0c;一位大侠要去救他的爱人&#xff0c;但天…

Selenium自动化测试入门:浏览器多窗口切换【建议收藏】

&#x1f345; 点击文末小卡片 &#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 有时web应用会打开多个浏览器窗口&#xff0c;当我们要定位新窗口中的元素时&#xff0c;我们需要将webDriver的handle&#xff08;句柄&#xff09;指定到新窗口…