【传知代码】基于曲率的图重新布线(论文复现)

前言:在图形处理中,一个至关重要的问题是图形的重新布线,即在不改变图形基本结构的前提下,通过调整节点间的连接关系,使图形具有更好的性质,如更低的复杂度、更高的可视化效果或更强的鲁棒性。传统的图形重新布线方法往往依赖于直观的经验或简单的启发式算法,难以适应复杂多变的应用场景,近年来,基于曲率的图重新布线技术应运而生,为图形优化领域带来了新的曙光。与传统的方法相比,基于曲率的图重新布线技术更加注重图形局部的几何特性,通过计算节点的曲率来指导重新布线的过程。

本文所涉及所有资源均在传知代码平台可获取

目录

概述

演示效果

核心代码

写在最后


概述

        大部分的图神经网络(Graph Neural Networks GNN)采用消息传递模式,在这种模式下,节点的特性会在输入的图上进行传递。近期的科学研究揭示,来自遥远节点的信息丢失确实是影响依赖于远程交互任务的消息传输效率的一个关键因素。这种限制通常被命名为“过度挤压”(Over-squashing)。图中每个结点的k跳邻居数量会随着k的增加而指数级增加,这导致远距离结点的信息很难被压缩到固定大小的结点特征中,从而造成信息的丢失,这是过度挤压的原因,这里参考了一下这篇论文,地址 具体如下:

        这篇文章为我们提供了GNN中的过度挤压现象的详细描述,并探讨了它是如何从图表中的瓶颈问题中产生的。因此,本研究提出了一种创新的基于边的组合曲率方法,并成功证实了负曲率边是引发过度挤压问题的根本原因。此外,本文还介绍了一种利用曲率进行图重现布线的策略,旨在减轻过度挤压的问题,如下图所示,上图:曲面上曲率的演变可能会减少瓶颈。下图:本文展示了如何在图上做同样的事情来提高GNN的性能。蓝色代表负曲率;红色代表正曲率:

接下来对本次论文讲述的核心算法进行如下一个简单的讲解:

1)黎曼几何中的一个自然对象是里奇曲率(Ricci curvature),这是一种决定测地线色散的双线性形式,即从“相同”速度的附近点开始的测地线是否保持平行(欧几里得空间)、收敛(球面空间)或发散(双曲空间)。

2)算法在每次迭代中都会添加一条边来支持图中最负曲率的边,然后移除最正曲率的边。

3)要求k∈B1(i),l∈B1(j)k∈B1​(i),l∈B1​(j)是为了确保我们在最负曲率的边i∼ji∼j周围添加额外的3-cycle或4-cycle。这是一个局部修改。

4)原始输入图和重新布线图之间的图编辑距离以max number of iterations的2倍为界。

5)temperatureτ>0τ>0决定了添加边的随机程度,τ=∞τ=∞表示总是添加最佳边。

6)移除曲率最大的边是为了平衡曲率和结点的度的分布。

7)使用Balanced Forman curvature计算Ric(i,j)Ric(i,j)

8)optimal Ric upper-boundC+C+用于防止算法使得曲率分布负偏斜。C+=∞C+=∞表示不移除任何边。

如下图所示:

演示效果

本次代码支持Cora, Citeseer, Pubmed, Cornell, Texas, Wisconsin 脚本自动下载,如不能请参考geom-gcn ,这里不同数据集的配置文件位于./configs/。运行之前需要修改数据集根目录和输出目录:

output_dir: $OUTPUT_DIR$
data:root: $DATA_ROOT$

测试集和训练集可以采用下面的方式进行:

# train on train data splits
python train.py --config-file configs/*.yaml
# test on val and test data splits
python eval.py --config-file configs/*.yaml
// 或
search_dir=configs
for file in "$search_dir"/*
dopython train.py --config-file $filepython eval.py --config-file $file
done

运行结果可以参考下面的方式,运行日志、模型权重、重新布线结果保存在$OUTPUT_DIR/$DATASET_NAME/ 测试结果(accuracy)保存在./result.csv:

核心代码

下面这段代码实现了对图数据进行流形学习的过程,其中使用了 Ricci 曲率作为度量距离的方法。具体来说,代码实现了一个基于 Ricci 曲率的图形变形算法,即 SDRF(Spectral Deformation and Ricci Flow)算法,该算法主要包含以下步骤:

1)将 Pytorch Geometric 中的数据类型 Data 转换为 NetworkX 中的数据类型 DiGraph,方便后续的加边、减边操作。

2)获取图的邻接矩阵和边的个数。

3)进入图的加边、减边循环过程,其中 max_iterations 为最大迭代次数:

4)将 NetworkX 中的数据类型 DiGraph 转换为 Pytorch Geometric 中的数据类型 Data,并返回。

        其中,BFC 算法是一种计算曲率的方法,用于计算 Ricci 曲率矩阵。具体来说,它通过计算形式曲率和平衡形式曲率之间的差异来计算 Ricci 曲率。在算法中,balanced_forman_curvature 函数用于计算 Ricci 曲率矩阵,balanced_forman_post_delta 函数用于计算边添加之后对 Ricci 曲率的提升程度。

SDRF 算法是一种流形学习算法,用于在图数据中计算距离和相似度。通过迭代加边、减边的方法,SDRF 算法可以将图数据进行形变,从而使得距离和相似度更加符合实际情况,代码如下:
 

def sdrf(data, max_iterations=10, remove_edges=True, remove_bound=0.5, tau=1.0, undirected=True):# 1. 将torch_geometric.data.Data实例转化为networkx.DiGraph实例,方便后续加边、减边操作G = to_networkx(data)if undirected:G = G.to_undirected()# 2. 获取图信息(邻接矩阵,边的个数)edge_index = data.edge_indexif undirected:edge_index = to_undirected(edge_index)A = to_dense_adj(remove_self_loops(edge_index)[0])[0]  # 邻接矩阵A = A.cuda()N = A.shape[0]  # 边的个数C = torch.zeros(N, N).cuda()  # 初始化Ricci曲率矩阵,即Ric(i, j)# 3. 进入图的加边、减边循环过程,其中max_iterations为最大迭代次数for x in range(max_iterations):can_add = True# 3.1 根据BFC算法更新Ricci曲率矩阵balanced_forman_curvature(A, C=C)ix_min = C.argmin().item()x = ix_min // Ny = ix_min % N# 3.2 计算可加边的候选集candidatesif undirected:x_neighbors = list(G.neighbors(x)) + [x]y_neighbors = list(G.neighbors(y)) + [y]else:x_neighbors = list(G.successors(x)) + [x]y_neighbors = list(G.predecessors(y)) + [y]candidates = []for i in x_neighbors:for j in y_neighbors:if (i != j) and (not G.has_edge(i, j)):candidates.append((i, j))# 3.3 根据边添加之后对Ricci曲率的提升程度,从候选集中选择边k~l进行添加if len(candidates):D = balanced_forman_post_delta(A, x, y, x_neighbors, y_neighbors)improvements = []for i, j in candidates:improvements.append((D - C[x, y])[x_neighbors.index(i), y_neighbors.index(j)].item())k, l = candidates[np.random.choice(range(len(candidates)), p=softmax(np.array(improvements), tau=tau))]G.add_edge(k, l)  # 添加边if undirected:A[k, l] = A[l, k] = 1else:A[k, l] = 1else:can_add = Falseif not remove_edges:break# 3.4 移除具有最大Ricci曲率的边,其中remove_bound为曲率最大上界if remove_edges:ix_max = C.argmax().item()x = ix_max // Ny = ix_max % Nif C[x, y] > remove_bound:G.remove_edge(x, y)  # 移除边if undirected:A[x, y] = A[y, x] = 0else:A[x, y] = 0else:if can_add is False:break# 4. 将networkx.DiGraph实例转化为torch_geometric.data.Data实例,返回return from_networkx(G)

写在最后

        在探索图形优化技术的道路上,基于曲率的图重新布线技术以其独特的视角和强大的能力,为我们揭示了图形处理领域的新可能。通过对节点曲率的精确计算和合理利用,这一技术不仅能够保持图形的整体结构稳定,更能在细节上精雕细琢,使图形展现出更加平滑、美观的视觉效果。

        回顾我们所探讨的内容,基于曲率的图重新布线技术凭借其先进性和实用性,已经在多个领域展现出了巨大的应用潜力。无论是社交网络分析中的用户关系优化,还是城市规划中的道路网络设计,甚至是生物科学中的蛋白质交互图研究,这一技术都为我们提供了全新的解决方案,随着技术的不断进步和应用领域的不断拓展,基于曲率的图重新布线技术将会迎来更加广阔的发展空间。我们可以预见,未来的图形优化将更加注重局部细节的优化和整体结构的稳定性,而基于曲率的图重新布线技术正是这一趋势的引领者。

详细复现过程的项目源码、数据和预训练好的模型可从该文章下方附件获取。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/343484.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高考志愿填报有哪些技巧和方法

一年一度高考季,又高考志愿填报的时侯了。高考志愿填报的时侯,需要考虑的因素比较多,有的同学觉是离家越远越好,要放飞自我,家长再也管不了我了。有的同学觉得专业比学校牌子重要,只要报个好专业&#xff0…

Ubuntu server 24 (Linux) AdGuard Home +SmartDNS 安装配置 搭建去广告快速DNS

一 SmartDNS 安装 ,可参考:Ubuntu server 24 (Linux) 安装部署smartdns 搭建智能DNS服务器-CSDN博客 二 安装AdGuard 1 下载地址:GitHub - AdguardTeam/AdGuardHome: Network-wide ads & trackers blocking DNS server 2 解压安装 #下…

文本审核纠错

探索高效文本审查利器:Word Checker-CSDN博客 GitHub - shibing624/pycorrector: pycorrector is a toolkit for text error correction. 文本纠错,实现了Kenlm,T5,MacBERT,ChatGLM3,LLaMA等模型应用在纠错…

编写程序提示用户输入一个数目(例如:100)、年利率(例如:5)以及月份数(例如:6),然后显示给定月份后账户上的钱数。

(财务应用程序:复利值)假设你每月向银行账户存 100美元,年利率为5%,那么每 月利率是 0.05/12-0.00417。 第一个月之后,账户上的值就变成:100*(10.00417)100.417 第二个月之后,账户上的值就变成(100100.417)*(10.00417)-201.252 第…

数据挖掘实战-基于Catboost算法的艾滋病数据可视化与建模分析

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

Llama模型家族之RLAIF 基于 AI 反馈的强化学习(三) RLAIF 的工作原理

LlaMA 3 系列博客 基于 LlaMA 3 LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 LangGraph 在windows本地部署大模型 (三) 基于 LlaMA…

Leetcode学习

回文数 反转一半数字 第一个想法是将数字转换为字符串,并检查字符串是否为回文。 但是,这需要额外的非常量空间来创建问题描述中所不允许的字符串。 第二个想法是将数字本身反转,然后将反转的数字与原始数字比较,如果它们是相同…

Excel 交叉表的格转成列,行转成格

Excel里交叉表的左表头是卡车号,上表头是工作,交叉格是工作编号。 ABCD1Truck NumberJob1Job2Job3271592859285928372395859282971473297159282971 要求:将交叉格转为列,左表头转为格。 ABC1297139585928272727137371473715726…

Android Webview 详解

一 简介 一个基于webkit引擎、展现web页面的控件 Android 4.4前:Android Webview在低版本 & 高版本采用了不同的webkit版本的内核Android 4.4后:直接使用了Chrome内核 1.1 作用 在 Android 客户端上加载h5页面在本地 与 h5页面实现交互 & …

CorelDRAW2024最新版本有哪些功能?揭秘设计界最新神器!

“设计”一词最早来源于拉丁语“designare”,意为计划,构思。随着时代的发展,人们将“设计”理解为一种创造性活动,通过这种活动,人们可以创造出新的产品、新的场景以及新的体验。 「CorelDRAW汉化版下载」&#xff0c…

【猫狗识别系统】图像识别Python+TensorFlow+卷积神经网络算法+人工智能深度学习

猫狗识别系统。通过TensorFlow搭建MobileNetV2轻量级卷积神经算法网络模型,通过对猫狗的图片数据集进行训练,得到一个进度较高的H5格式的模型文件。然后使用Django框架搭建了一个Web网页端可视化操作界面。实现用户上传一张图片识别其名称。 一、前言 …

外部mysql导入

利用这个命令&#xff1a; mysql -u username -p database_name < file.sql 然后就这样。成功导入。

【全开源】废品回收垃圾回收小程序APP公众号源码PHP版本

&#x1f31f;废品回收小程序&#xff1a;绿色生活的新助手&#x1f331; 一、引言 随着环保意识的逐渐提高&#xff0c;废品回收成为了我们日常生活中的重要一环。但是&#xff0c;如何更方便、高效地进行废品回收呢&#xff1f;今天&#xff0c;我要向大家推荐一款超级实用…

22 - 游戏玩法分析 IV(高频 SQL 50 题基础版)

22 - 游戏玩法分析 IV 考点&#xff1a; 聚合函数 # 日期相加 date_add(min(event_date),INTERVAL 1 DAY) select round(count(distinct player_id)/(select count(distinct player_id) from Activity),2) fraction fromActivity where-- 如果日期加一天的数据能在表中…

ffmpeg视频编码原理和实战-(2)视频帧的创建和编码packet压缩

源文件&#xff1a; #include <iostream> using namespace std; extern "C" { //指定函数是c语言函数&#xff0c;函数名不包含重载标注 //引用ffmpeg头文件 #include <libavcodec/avcodec.h> } //预处理指令导入库 #pragma comment(lib,"avcodec.…

覆盖路径规划经典算法 The Boustrophedon Cellular Decomposition 详解

2000年一篇论文 Coverage of Known Spaces: The Boustrophedon Cellular Decomposition 横空出世&#xff0c;解决了很多计算机和机器人领域的覆盖路径问题&#xff0c;今天我来详细解读这个算法。 The Boustrophedon Cellular Decomposition 算法详解 这篇论文标题为"C…

Ubuntu系统本地搭建WordPress网站并发布公网实现远程访问

文章目录 前言1. 搭建网站&#xff1a;安装WordPress2. 搭建网站&#xff1a;创建WordPress数据库3. 搭建网站&#xff1a;安装相对URL插件4. 搭建网站&#xff1a;内网穿透发布网站4.1 命令行方式&#xff1a;4.2. 配置wordpress公网地址 5. 固定WordPress公网地址5.1. 固定地…

UE5 Mod Support 思路——纯蓝图

原创作者&#xff1a;Chatouille 核心功能 “Get Blueprint Assets”节点&#xff0c;用于加载未来的mod。用基础类BP_Base扩展即可。打包成补丁&#xff0c;放到Content\Paks目录下&#xff0c;即可让游戏访问到内容。 与文中所写不同的地方 5.1或者5.2开始&#xff0c;打…

【YOLOv10】使用 TensorRT C++ API 调用GPU加速部署 YOLOv10 实现 500FPS 推理速度——快到飞起!

NVIDIA TensorRT ™ 是一款用于高性能深度学习推理的 SDK&#xff0c;包含深度学习推理优化器和运行时&#xff0c;可为推理应用程序提供低延迟和高吞吐量。YOLOv10是清华大学研究人员近期提出的一种实时目标检测方法&#xff0c;通过消除NMS、优化模型架构和引入创新模块等策…

WWDC24即将到来,ios18放大招

苹果公司即将在下周开全球开发者大会(WWDC)&#xff0c;大会上将展示其人工智能技术整合到设备和软件中的重大进展,包括与OpenAI的历史性合作。随着大会的临近,有关iOS 18及其据称采用AI技术支持的应用程序和功能的各种泄露信息已经浮出水面。 据报道,苹果将利用其自主研发的大…