为什么使用图神经网络?
在本书中,我们将重点介绍图学习技术中的深度学习家族,通常称为图神经网络。GNNs是一种新的深度学习架构类别,专门设计用于处理图结构化数据。与主要用于文本和图像的传统深度学习算法不同,GNNs明确地用于处理和分析图数据集(见图1.4)。
图1.4 - GNN管道的高级架构,以图作为输入,输出对应于给定任务
GNNs已经成为图学习的强大工具,在各种任务和行业中显示出优秀的结果。其中最引人注目的例子之一是GNN模型如何发现了一种新的抗生素[2]。该模型在2500种分子上进行了训练,并在6000种化合物的库中进行了测试。它预测到一种名为halicin的分子应该能够杀死许多抗生素耐药的细菌,同时对人体细胞的毒性很低。基于这一预测,研究人员使用halicin治疗感染了抗生素耐药细菌的小鼠。他们证明了其有效性,并相信该模型可以用于设计新药。
GNNs是如何工作的呢?让我们以社交网络中的节点分类任务为例,就像之前的家谱示例(图1.3)一样。在节点分类任务中,GNNs利用来自不同来源的信息创建图中每个节点的向量表示。这个表示不仅包括原始节点特征(如姓名、年龄和性别),还包括边特征(如节点之间的关系强度)和全局特征(如整个网络的统计信息)。
这就是为什么GNNs在处理图上的机器学习任务中比传统技术更高效。GNNs不仅局限于原始属性,还可以使用邻居节点