异构超图嵌入的图分类 笔记

1 Title

        Heterogeneous Hypergraph Embedding for Graph Classification(Xiangguo Sun ,  PictureHongzhi Yin ,  PictureBo Liu ,  PictureHongxu Chen , PictureJiuxin Cao , PictureYingxia Shao , PictureNguyen Quoc Viet Hung)【WSDM 2021】

2 Conclusion

        This paper proposes a graph neural network-based representation learning framework for heterogeneous hypergraphs, an extension of conventional graphs, which can well characterize multiple non-pairwise relations. Our framework first projects the heterogeneous hypergraph into a series of snapshots and then we take the Wavelet basis to perform localized hypergraph convolution. Since the Wavelet basis is usually much sparser than the Fourier basis, this study develops an efficient polynomial approximation to the basis to replace the time-consuming Laplacian decomposition. Extensive evaluations have been conducted and the experimental results show the superiority of this method.

3 Good Sentences

        1、Most of these methods focus on the pairwise relationships between objects in the constructed graphs.In many real-world scenarios, however, relationships among objects are not dyadic (pairwise) but rather triadic, tetradic, or higher. Squeezing the high-order relations into pairwise ones leads to information loss and impedes expressiveness.(The necessary of hypergraph for model building)
        2、But there are key differences between heterogeneous simple graphs and heterogeneous hypergraphs. Even for those homogeneous simple graphs like Figure 2, the same type nodes may also be connected according to different semantics that are represented by different types of hyperedges, making the hypergraph heterogeneous(The challenge of hypergraph meets)
        3、However, the above operation has the following two major issues. First, it is not localized in the vertex domain, which cannot fully empower the convolutional operation. Secondly, eigenvectors are explicitly used in convolutions, requiring the eigen-decomposition of the Laplacian matrix for each snapshot in 𝐺.(The disadvantages of the method that used the Fourier transform to learn hypergraph embedding)


        在许多现实世界的场景中,对象之间的关系不是二元的(成对的),而是三元的、四元的或更高级的。将高阶关系压缩成成对关系会导致信息损失并妨碍表达能力,为了解决这个问题,引入了超图。

在线社交论坛上的异构超图示例。有几种类型的超边缘,包括特定用户创建的所有帖子和评论(紫色圆圈)、同一组中的所有帖子和评论(橙色圆圈)以及包含所有评论的帖子(蓝色圆圈)。

超图挑战1:相同类型的节点也可能根据由不同类型的超边表示的不同语义进行连接,从而使超图异构
超图挑战2:消息可以直接从简单图中的一跳邻居聚合。然而,超图上的消息传播更加复杂。它应该首先在同一个超边内聚合,然后在连接到目标节点的所有超边上聚合。这种差异使得传统的基于GNN的方法不适用于超图

为了解决挑战1,本文首先提取具有不同元路径的简单图快照,然后根据超边类型在这些简单图上构造几个超图快照。分解后,每个快照都是同质的,它们也可以很容易地并行计算,使模型可扩展到大型数据集。

为了解决挑战2,本文通过用小波基代替傅立叶基来设计超图卷积。与顶点域中的方法相比,这种谱方法不需要考虑超图中复杂的消息传递模式,并且还可以执行局部卷积,小波基比傅立叶基稀疏得多,它可以通过多项式有效地近似而无需拉普拉斯分解

一些定义:

        Simple Graph Snapshots:.

根据选择的元路径,可以从原始异构简单图中提取相应的子图。以图a为例,用用户(U)和部门(D)作为节点来表示社交网络,其中边表示友谊(U-U)和从属关系(U-D)。根据元路径U-U和元路径U-D提取路径,然后我们可以生成两个子图作为简单图的两个快照。

Heterogeneous Hypergraph:一个异构超图可以定义为G = {V,\varepsilon,T𝑣,T𝑒,W},其中,V是顶点集,T𝑣是顶点类型集。\varepsilon是一组超边,T𝑒是超边类型的集合。当|T𝑣|+|T𝑒|>2时,超图是异构的。W是超边权重的对角矩阵,节点和超边之间的关系可以由关联矩阵H 表示

        让D𝑣 ∈ R^{V*V}和D𝑒 ∈ R^{E*E}分别表示包含顶点度和超边度的对角矩阵,其中D_v(i,i)=\sum _{e\in \varepsilon }W(e)H(i,e)D_e(i,i)=\sum _{v\in V }H(v,i)。让\Theta =D_v^{-1/2}HWD_e^{-1}H^TD_v^{-1/2},然后拉普拉斯算子就可以表示为\Delta =I-\Theta

Hypergraph Snapshots:超图G = {V,E}的Snapshot可以被定义为G𝑒 = {V𝑒,E𝑒 }的子图。这里V𝑒和E𝑒分别是V和E的子集,超图快照是根据超边类型生成的,这意味着\varepsilon _e中的所有超边都应属于同一超边类型。如图所示,三种超图snapshot各包含一种超边类型。

异构超图嵌入:

        异构超图嵌入框架的概述如图所示。输入是一个简单的图形。如果简单图是异构的,则先提取具有不同元路径的简单图快照。之后在这些简单图上构造超图,然后将它们分解成多个超图快照,再然后使用开发的超图小波神经网络(HWNN)来学习每个快照中的节点嵌入,然后将这些快照聚合为用于下游分类的综合表示

HWNN: Hypergraph Wavelet Neural Networks:

        对于每个顶点𝑣𝑖 ∈ V,首先通过全局嵌入矩阵查找其初始向量表示v𝑖 ∈ R^{C\times 1},然后将其投影到不同类型超边的子空间中,具有超边类型𝑡𝑒 ∈ T𝑒的超边特定空间中的顶点𝑣𝑖的表示计算如下:其中M𝑡𝑒 ∈R^{C \times C}是𝑡𝑒的超边特定投影矩阵。

Hypergraph convolution via Fourier basis

        对于从原始异构超图中提取的每个快照G𝑒 = {V𝑒,E𝑒,W},其拉普拉斯矩阵:\Delta^{G_e}=I-\Theta ^{G_e},其中,

x_t^{G_e}(v_i)=v_i^{t_e}(t),其中𝑡是v_i^{t_e}中元素的索引,𝑡 = 1,.......,𝐶,则,超图拉普拉斯\Delta ^{G_e}是一个|V | × |V |正半定矩阵,它可以对角化为:,其中U是傅立叶基,它包含由其非负特征值排序的标准正交特征向量的完整集合,根据卷积定理,x_t^{G_e}和滤波器y的卷积运算*hG可以写成它们的傅里叶变换的逐元Hadamard之后的傅里叶反变换:

其中是滤波器的傅里叶变换,

但是,上述操作存在以下两大问题。

首先,它没有定位在顶点域,这不能充分授权卷积操作。其次,特征向量显式地用于卷积,需要对𝐺中的每个快照的拉普拉斯矩阵进行特征分解。为了解决这些问题,本文建议用小波基代替傅立叶基。

选择小波基代替原来的傅立叶基的基本原理如下。首先,小波基比傅里叶基稀疏得多,最适合现代GPU架构进行高效训练。此外,利用小波基的性质,可以更容易地实现有效的多项式近似。

基于这一特征,可以进一步提出图小波的多项式近似,从而不再需要拉普拉斯矩阵的特征分解。最后但并非最不重要的是,小波表示信息扩散过程,非常适合在顶点域实现局部卷积。.

Hypergraph convolution based on wavelets:

为带有缩放参数s的小波基,

其中是超图拉普拉斯算子\Delta ^{G_e}的特征值,接着用小波基替换傅里叶基,可得:

在上式中,是滤波器的谱变换,

另外,本文采用StoneWeierstrass定理[10]来逼近图小波,而不需要拉普拉斯矩阵的特征分解,使该方法更加高效。

Stone-Weierstrass定理与多项式近似:

Stone-Weierstrass定理指出热核矩阵restricted to,可以近似为,其中其中𝐾是多项式阶。包含超图拉普拉斯的特征值

是每个项都有上界的残差:

综上,图小波基就可以近似为:,而\Delta ^{G_e}可以看作是\Theta ^{G_e}的一阶多项式,该式就可以改写为

再之后,可以用s替换-s,使用一组平行的参数来近似

于是,有公式

那么,超边卷积神经网络可以表示为:.

可以通过将特征变换从卷积中分离出来进一步减少滤波器的数量,其中,W为特征项目矩阵,设Z^{G_e}=(X^{G_e})^{m+1}式最后一层Z^{G_e}=(X^G_e)^{m+1}的输出,那么对于所有的快照,其graph representations为:,⊕为级联操作,Z为Z^{G_i},i=1,2,3\cdot \cdot \cdot |T_e|的级联操作,最后,异构超图G的表示可以通过对其所有快照求和来计算:

        

其中𝑓是多层感知器。

在节点分类任务中,待分类类别为C_{m+1}。损失函数可以与所有标记样本上的交叉熵误差和投影矩阵上的正则化器相结合,其中V_{l}是标记节点的集合,Y_{v,i}是节点𝑣在类别上的标签值i。如果节点𝑣属于类别i,否则为0。𝜂是正则化器的权衡参数。被作为正则项,也可以用L-2范式替代。

以上是用在节点分类任务上的结果,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/313328.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

哪个品牌蓝牙耳机好?掌握六大选购逻辑,选准不选贵!

​随着科技的不断进步,蓝牙耳机已经成为了我们生活中不可或缺的一部分。它不仅摆脱了有线的束缚,还提供了极大的自由度。然而,面对市场上琳琅满目的蓝牙耳机,挑选一款性价比高的产品确实需要一些技巧。作为一名资深的耳机用户&…

民族运动饮料之父『健力宝』×企企通正式启动SRM项目,打造饮料行业采购数字化应用标杆

近日,为推进采购阳光化、数字化和智能化,提升管理效率与质量,企企通与中国电解质饮料的领军品牌广东健力宝股份有限公司(以下简称“健力宝”)成功签约并召开项目启动会。健力宝行政副总裁赵总、CIO李总、采购本部总监杨…

论文解读:(CoOp)Learning to Prompt for Vision-Language Models

文章汇总 存在的问题 虽然训练类别通常具有文本形式,例如“金鱼”或“卫生纸”,但它们将被转换为离散标签,只是为了简化交叉熵损失的计算,从而使文本中的语义封装在很大程度上未被利用。这样的学习范式将视觉识别系统限制在闭集…

代码随想录阅读笔记-回溯【N皇后】

题目 n 皇后问题 研究的是如何将 n 个皇后放置在 nn 的棋盘上,并且使皇后彼此之间不能相互攻击。 给你一个整数 n ,返回所有不同的 n 皇后问题 的解决方案。 每一种解法包含一个不同的 n 皇后问题 的棋子放置方案,该方案中 Q 和 . 分别代表…

Java垃圾回收2

垃圾回收的算法有哪些 通过可达性分析算法,我们已经可以找到需要回收的对象。现在需要通过垃圾回收算法,把垃圾回收,释放内存。 1.标记清除算法(使用较少) 标记清除算法,是将垃圾回收分为2个阶段,分别是标记和清除。…

FreeRTOS任务管理

1. 任务状态理论讲解 定时器职中断周期此处的1000Hz表示的是没次间隔1毫秒就记一次数(在FreeConfig.h)文件中进行配置 #define configTICK_RATE_HZ ( ( TickType_t ) 1000 ) 判断是否需要任务切换在FreeRTOS里面每次间隔1毫秒切换一次(程序…

【iOS开发】(二)react Native基础语法+样式+布局20240417

【IOS开发】 前言:(一)我们已经搭建好了基础环境,和iOS环境,并创建和在模拟器上成功运行了一个app,mywdm。 目录标题 一, 如何进行模拟器调试二,基础语法:1 掌握reactjs…

网站创建的流程是什么

网站的创建过程包括几个主要的步骤,其中涉及到一系列的决策和实践操作。下面我将详细介绍网站创建的流程,帮助读者了解如何创建一个成功的网站。 第一步:确定网站目标和功能 在创建网站之前,你需要明确自己网站的目标和功能。是用…

AT32F415CBT7 封装LQFP-48 单片机微控制器IC芯片

ARM Cortex-M4 内核:AT32F415CBT7 采用 32 位 ARM Cortex-M4 内核,工作频率高达 200 MHz,具有较高的处理能力和响应速度。 大容量闪存存储器:该单片机内置 256KB 的闪存存储器(Flash),可以存储…

Hadoop中的MapReduce流程(图解)

一、MapReduce流程图: 二、MapReduce流程步骤: 1.文件上传到HDFS中,默认以128M切分为一个block块 2.每个block块对数据进行逻辑上的切片,切片大小为128M,与block块大小一致 3.之后根据切片产生Map任务 4.Map任务会进入环形缓冲区&…

Linux 操作系统指令和Vscdoe安装

1、Linux系统介绍 Linux系统的背景介绍我就不介绍了,有兴趣的可以去看看其发展史。 1.1 Linux操作系统的主要特点 Linux操作系统的重要思想:一切皆文件 Linux操作系统的特性: 完全免费 支持多平台 支持多用户、多任务 有良好的界面 完美兼容…

引导过程与故障修复

一、Linux操作系统引导过程 1、引导过程总览 开机自检 检查硬件设备,检测出第一个能够引导系统的设备,比如硬盘或者光驱 MBR 引导 运行MBR扇区里的主引导程序GRUB 启动GRUB菜单 统读取GRUB配置文件(/boot/grub2/grub.cfg)获取内核的设置和位置&#xf…

如何进行数据库的迁移与同步——【DBA 从入门到实践】第四期

在日常的数据库运维工作中,我们时常会面临数据库替换、机房搬迁、业务测试以及数据库升级等任务,这些任务都需要对数据进行迁移和同步操作。【DBA 从入门到实践】第4期,将引导大家深入了解数据库迁移的流程,并探讨在迁移过程中可用…

CTFHUB RCE作业

题目地址:CTFHub 完成情况如图: 知识点: preg_match_all 函数 正则匹配函数 int preg_match_all ( string $pattern , string $subject [, array &$matches [, int $flags PREG_PATTERN_ORDER [, int $offset 0 ]]] )搜索 subject 中…

Django第三方功能的使用

Django第三方功能的使用 Django REST framework前言1、Django--Restframework--coreapi版文档BUG:AssertionError: coreapi must be installed for schema support.How to run Django with Uvicorn webserver?2、序列化类 Serializer的使用模型序列化类 ModelSerializer的使用…

linux 安装openjdk-1.8

安装命令 yum install java-1.8.0-openjdk-1.8.0.262.b10-1.el7.x86_64查看安装路径 find / -name java 默认的安装路径 /usr/lib/jvm 查看到jre 以及java-1.8.0-openjdk-1.8.0.262.b10-1.el7.x86_64 配置环境变量 vim /etc/profile 添加的内容 export JAVA_HOME/usr/li…

【面试经典 150 | 二分查找】寻找两个正序数组的中位数

文章目录 写在前面Tag题目来源题目解读方法一:朴素方法二:二分查找【寻找第k小元素】 写在最后 写在前面 本专栏专注于分析与讲解【面试经典150】算法,两到三天更新一篇文章,欢迎催更…… 专栏内容以分析题目为主,并附…

[大模型]Qwen-7B-hat Transformers 部署调用

Qwen-7B-hat Transformers 部署调用 环境准备 在autodl平台中租一个3090等24G显存的显卡机器,如下图所示镜像选择PyTorch–>2.0.0–>3.8(ubuntu20.04)–>11.8 接下来打开刚刚租用服务器的JupyterLab,并且打开其中的终端开始环境配置、模型下…

华为机考入门python3--(15)牛客15-求int型正整数在内存中存储时1的个数

分类:二进制 知识点: int转二进制 binary bin(n)[2:] 题目来自【牛客】 def count_ones_in_binary(n): # 将输入的整数转换为二进制字符串 # bin(n)为0b11011binary bin(n)[2:]# 初始化计数器为0 count 0 # 遍历二进制字符串的每一位 fo…

LoRA模型是什么?

AI Agent能力评测工具AgentBench评测结果 LoRA模型是什么? LoRA模型(Low-Rank Adaptation of Large Language Models)是一种针对大型语言模型(LLMs)的微调技术,其目的是在保持模型原有性能的基础上&#x…