WeekPaper:GraphTranslator将知识图谱与大模型对齐

在这里插入图片描述
GraphTranslator: 将图模型与大型语言模型对齐,用于开放式任务。
将基于图的结构和信息与大型语言模型的能力整合在一起,以提高在涉及复杂和多样数据的任务中的性能。其目标是利用图模型和大型语言模型的优势,解决需要处理和理解结构化和非结构化数据的各种任务。对齐过程可能涉及调整图结构和基于语言的表示之间的表示和交互,以有效处理各个领域中的开放式任务。

视频地址:https://space.bilibili.com/431850986/channel/series
Git地址:https://datawhalechina.github.io/whale-paper/

目录

在这里插入图片描述

背景

在这里插入图片描述

  • “神经处理结构化输入” - 表明图神经网络(GNNs)旨在处理以图形式结构化的数据。
  • “SOTA性能和广泛应用范围” - SOTA可能代表“最新技术”,表明GNN在各种应用中取得领先性能。
  • “受限于预定义格式内的任务” - 后面跟着一个括号中的示例:“(例如,节点分类)”。
    常见任务:
  • “节点分类” - 显示了一个小图,有节点(圆圈)和连接节点的边(线)。一个节点被突出显示,表示分类的目标节点。
  • “图分类” - 描绘了两个不同结构的图,暗示了对整个图进行分类的任务,而不是对单个节点进行分类。
  • “社区检测” - 显示了一个较大的图,节点被聚类,并用不同颜色标记。一个虚线红色框围绕着一个社区,表示在图中检测到一个社区。

在这里插入图片描述

  • 基础模型
  • 下游任务适配
  • 在开域领域表现好
  • 在特定领域不一定有小模型好,幻觉问题
  • 大型语言模型的特点:
  • “当参数数量达到一定规模时,模型参与度大”
  • “展示出对开放式任务的强大能力”
  • “由于产生幻觉和成本高昂,无法适应纯定义任务的真实自然语言指令”

动机

在这里插入图片描述

  • 图数据送给大模型,是生成节点的embedding
  • 现有工作:LLM作为增强器,LLM作为预测器
  • “Goals”:建立一个既能解决预定义任务又能处理开放式任务的模型的目标。有一个文本框强调了创造具有这种双重能力的模型的愿望。
  • “Challenges”:“预训练GM和LLM之间的显著模态差距”和“缺乏用于连接GM和LLM的对齐数据”。这表明由于模态之间的差异以及缺乏有效对齐数据,整合图形模型和语言模型存在困难。

model

在这里插入图片描述

  • 四个模块
  • 学习文本属性图模型的节点表示
  • 使用GraphTranslator处理预定义任务
  • 构建、对齐、连接(节点表示、描述性文本)对。
  • 作为预定义、后续和开放式任务的统一接口,根据人类指令进行训练。

在这里插入图片描述

  • “Frozen Graph Model”(冻结图模型)
  • “Text-Attributed Graph”(文本属性图),后面跟着一个关于图G的数学符号描述,TAG G = (V, A, {S_0}uSEV)。BoW代表词袋模型
  • 一个节点的特征向量与其邻居的特征向量进行聚合,然后通过函数sigma和权重矩阵W进行转换

在这里插入图片描述

  • 生产者模块”(Construct Model: Producer Module)
  • 节点对齐数据:描述了节点对齐数据包括节点特征、邻居信息以及它们与时间戳的组合
  • 使用“思维链(CoT)引导 GPT 逐步生成高质量描述”
  • 流程图,包含三个主要组件标记为 A、B 和 C。每个组件之间通过箭头连接,表示信息流或处理步骤。这些组件描述如下:
    A. 源节点信息
    B. 摘要邻居信息
    C. 聚合器

在这里插入图片描述

  • “翻译模块”(Translator Module)的模型
  • 分两个阶段
  • 翻译模块的架构,分为两个训练阶段:
    • 训练阶段1:对齐 GM-Text
    • 训练阶段2:对齐 GM-LM
  • 共享自注意力: 用于在两个编码器之间对齐或相关信息的机制

在这里插入图片描述

  • 阶段1:对比学习loss
  • 翻译器(Translator)
    共享注意力(Shared Attention)
  • 查询标记(Query Tokens)和描述性标记(Descriptive Tokens)
  • 交叉注意力(Cross Attention)
  • 模型训练(阶段1)构建: 右侧包括三个项目符号,每个描述一个不同的目标:
    • 对比目标(Contrastive Objective): 包括节点表示对齐和在批次内计算相似性。
    • 节点匹配目标(Node Matching Objective): 包括将标记与文本表示匹配和对齐。
    • 节点表示目标(Node Representation Objective): 包括生成,特别是用特殊标记替换第一个标记作为解码器解决的任务。
      在这里插入图片描述
  • 阶段2:过一个投影层,总结用户和邻接节点的信息去生成response
  • 图表展示了一个机器学习模型的架构,包括以下组件和步骤:
    • H_stage1: 这个组件代表第一阶段训练的输出。
    • Projector: 一个线性层,用于将H_stage1投影到LLM(大型语言模型)的标记表示空间。
    • Cross Attention和Shared Self-Attention: 这两个组件接收投影输出,并可能涉及在模型中对不同部分进行关注和交互。
    • Language Response和Descriptive Actions: 这些组件可能与模型的输出和相应的描述性动作或指令有关。
  • 使用线性层将H_stage1投影到LLM的标记表示空间。
  • 将投影表示与人类指令连接,并通过对齐描述性文本的翻译器,将其输入到微调响应文本中。

实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

结论

在这里插入图片描述
综述文章
在这里插入图片描述
“Towards Graph Foundation Models: A Survey and Beyond(走向图基础模型:调查与未来)”摘要讨论了基础模型在各个领域的重要性,特别是在自然语言处理和其他人工智能应用中。它提到这些模型由于其迁移学习能力在多个领域取得了显著成功。该论文旨在探索图基础模型的潜力以及它们在各种下游任务中的适应性。它还讨论了图学习范式同质化能力的挑战,以及需要多样化和去中心化方法的必要性。
作者提出了通过大数据和学习方法上的预训练图进行转变性转变。摘要指出,该论文将对现有关于图基础模型的工作进行系统回顾,包括它们的分类、使用的技术和框架,以及对该领域未来的影响。它还提到该论文将讨论开放挑战、新方向以及在这一领域跨学科研究的重要性。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/292436.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

XSS伪协议

XSS伪协议简介 XSS(跨站脚本攻击)中的伪协议是指利用一些浏览器允许的特殊协议来执行恶意脚本的一种方式。常见的伪协议包括 javascript:, data:, vbscript: 等。 攻击者可以通过构造特定的URL,将恶意脚本注入到网页中,从而实现…

【C++】C到C++的入门知识

目录 1、C关键字 2、命名空间 2.1 命名空间的定义 2.2 命名空间的使用 2.2.1 加命名空间名称及作用域限定符 2.2.2 使用using将命名空间中某个成员引入 2.2.3 使用using namespace 命名空间名称引入 3、C输入&输出 4、缺省参数 4.1 缺省参数的概念 4.2 缺省参数的…

浅析AI大模型当前存在的技术瓶颈和限制及解决方案

方向五:未来发展趋势与挑战 提示:展望AI大模型学习的未来发展趋势,并讨论当前面临的主要挑战。可以关注新技术、新方法的出现,以及它们对AI大模型学习的影响;同时,也可以分析当前存在的技术瓶颈和限制&…

Linux 学习之路--工具篇--yum

前面介绍了权限有关的内容&#xff0c;这里继续介绍有关Linux里面常用的工具之一yum 目录 一、简单介绍 <1> 源代码安装 <2>rpm 包安装 <3>yum / apt-get(ubuntu) 安装 二、简单使用 <1>安装包介绍 <2> yum 的基本指令 -- install <…

JavaScript(一)---【js的两种导入方式、全局作用域、函数作用域、块作用域】

一.JavaScript介绍 1.1什么是JavaScript JavaScript简称“js”&#xff0c;js与java没有任何关系。 js是一种“轻量级、解释型、面向对象的脚本语言”。 二.JavaScript的两种导入方式 2.1内联式 在HTML文档中使用<script>标签直接引用。 <script>console.log…

人脸68关键点与K210疲劳检测

目录 人脸68关键点检测 检测闭眼睁眼 双眼关键点检测 计算眼睛的闭合程度&#xff1a; 原理: 设置阈值进行判断 实时监测和更新 拓展&#xff1a;通过判断上下眼皮重合程度去判断是否闭眼 检测嘴巴是否闭合 提取嘴唇上下轮廓的关键点 计算嘴唇上下轮廓关键点之间的距…

SQLite中的动态内存分配(五)

返回&#xff1a;SQLite—系列文章目录 上一篇&#xff1a;SQLite中的原子提交&#xff08;四&#xff09; 下一篇:自己编译SQLite或将SQLite移植到新的操作系统&#xff08;六&#xff09; ​概述 SQLite使用动态内存分配来获得 用于存储各种对象的内存 &#xff08;例如…

【微服务】spring状态机模式使用详解

一、前言 在很多系统中&#xff0c;通常会涉及到某个业务需要进行各种状态的切换操作&#xff0c;例如在审批流程场景下&#xff0c;某个审批的向下流转需要依赖于上一个状态的结束&#xff0c;再比如电商购物场景中&#xff0c;一个订单的生命周期往往伴随着不同的状态&#…

蓝桥集训之游戏

蓝桥集训之游戏 核心思想&#xff1a;博弈论 区间dp 设玩家1的最优解为A 玩家2的最优解为B 1的目标就是使A-B最大 2的目标就是使B-A最大 当玩家1取L左端点时 右边子区间结果就是玩家2的最优解B-A 即当前结果为w[L] – (B-A) 当玩家1取R右端点时 左边子区间结果就是玩家2的最…

docker部署DOS游戏

下载镜像 docker pull registry.cn-beijing.aliyuncs.com/wuxingge123/dosgame-web-docker:latestdocker-compose部署 vim docker-compose.yml version: 3 services:dosgame:container_name: dosgameimage: registry.cn-beijing.aliyuncs.com/wuxingge123/dosgame-web-docke…

【Leetcode每日一题】 递归 - 求根节点到叶节点数字之和(难度⭐⭐)(47)

1. 题目解析 题目链接&#xff1a;129. 求根节点到叶节点数字之和 这个问题的理解其实相当简单&#xff0c;只需看一下示例&#xff0c;基本就能明白其含义了。 2.算法原理 递归函数设计&#xff1a; 我们设计了一个递归函数 int dfs(TreeNode* root, int num)&#xff0c;其…

酷得单片机方案 2.4G儿童遥控漂移车

电子方案开发定制&#xff0c;我们是专业的 东莞酷得智能单片机方案之2.4G遥控玩具童车具有以下比较有特色的特点&#xff1a; 1、内置充电电池&#xff1a;这款小车配备了可充电的电池&#xff0c;无需频繁更换电池&#xff0c;既环保又方便。充电方式可能为USB充电或者专用…

如何使用Docker轻松构建和管理应用程序(二)

上一篇文章介绍了 Docker 基本概念&#xff0c;其中镜像、容器和 Dockerfile 。我们使用 Dockerfile 定义镜像&#xff0c;依赖镜像来运行容器&#xff0c;因此 Dockerfile 是镜像和容器的关键&#xff0c;Dockerfile 可以非常容易的定义镜像内容&#xff0c;同时在我们后期的微…

【Consul】Linux安装Consul保姆级教程

【Consul】Linux安装Consul保姆级教程 大家好 我是寸铁&#x1f44a; 总结了一篇【Consul】Linux安装Consul保姆级教程✨ 喜欢的小伙伴可以点点关注 &#x1f49d; 前言 今天要把编写的go程序放到linux上进行测试Consul服务注册与发现&#xff0c;那怎么样才能实现这一过程&am…

docker在线安装centos7(windows版)

目录 1、docker本地安装2、拉取centos7镜像3、启动容器4、配置SSH以访问centos7 1、docker本地安装 windows安装docker比较简单&#xff0c;官网搜索有个docker desktop装上就完事。 2、拉取centos7镜像 可以登录到docker hub上拉&#xff0c;也可以搜出来对应的centos7镜像…

3D检测:从pointnet,voxelnet,pointpillar到centerpoint

记录centerpoint学习笔记。目前被引用1275次&#xff0c;非常高。 地址&#xff1a;Center-Based 3D Object Detection and Tracking (thecvf.com) GitHub - tianweiy/CenterPoint CenterPoint&#xff1a;三维点云目标检测算法梳理及最新进展&#xff08;CVPR2021&#xff…

【蓝桥杯嵌入式】六、真题演练(一)-1演练篇:第 届真题

温馨提示&#xff1a; 真题演练分为模拟篇和研究篇。本专栏的主要作用是记录我的备赛过程&#xff0c;我打算先自己做一遍&#xff0c;把遇到的问题和不同之处记录到演练篇&#xff0c;然后再返回来仔细研究一下&#xff0c;找到最佳的解题方法记录到研究篇。 解题记录&#x…

android WMS服务

android WMS服务 WMS的定义 窗口的分类 WMS的启动 WindowManager Activity、Window、DecorView、ViewRootImpl 之间的关系 WindowToken WMS的定义 WMS是WindowManagerService的简称&#xff0c;它是android系统的核心服务之一&#xff0c;它在android的显示功能中扮演着…

python基础——异常捕获【try-except、else、finally】

&#x1f4dd;前言&#xff1a; 这篇文章主要介绍一下python基础中的异常处理&#xff1a; 1&#xff0c;异常 2&#xff0c;异常的捕获 3&#xff0c;finally语句 &#x1f3ac;个人简介&#xff1a;努力学习ing &#x1f4cb;个人专栏&#xff1a;C语言入门基础以及python入门…

github配置ssh

生成公钥 在电脑用户的目录下打开终端执行 ssh-keygen -t rsa: 执行完不要关 配置文件 看看用户的目录里 .ssh 目录&#xff1a; Host github.comHostname ssh.github.comPort 443配置公钥 复制 id_rsa.pub 文件里的内容 粘贴到 github上 连接密钥 回到刚才的终端…