论文阅读【时空+大模型】ST-LLM（MDM2024）

论文阅读【时空+大模型】ST-LLM（MDM2024）

news/2024/11/23 23:58:33/文章来源:https://blog.csdn.net/micaudience/article/details/140356174

论文阅读【时空+大模型】ST-LLM（MDM2024）

论文链接：Spatial-Temporal Large Language Model for Traffic Prediction
代码仓库：https://github.com/ChenxiLiu-HNU/ST-LLM
发表于MDM2024（Mobile Data Management）

本文主要面向交通流量数据。
在这里插入图片描述

符号定义

符号	含义
N	交通站点数
C	特征数量
P	历史序列长度
S	预测序列长度

Spatial-Temporal Embedding and Fusion

注： $X_P \isin R^{P*N*C}$ ，但在本文实验中C=1(原文“C = 1 represents the traffic pick-up or drop-off flow”)，因而有 $X_P \isin R^{P*N}$

一般而言，spatial-temporal embedding分为：

Token Embedding: $E_P = PointwiseConv(X_P) \isin R^{N * D}$
Temporal Embedding: $E_T = E_T^d+E_T^w = W_{day}(X_{day}) + W_{week}(X_{week})\isin R^{N *D}$
Spatial Embedding: $E_S = \sigma (W_S * X_P + b_S) \isin R^{N * D}$

然后将三种embedding合并：

$H_F = FusionConv(E_P||E_S||E_T) \isin R^{N*3D}$
其中’||'是拼接符号。

Partially Frozen Attention (PFA) LLM

这部分使用GPT2捕获时空依赖。Transformer Block中训练时空开销最大的是注意力（Attention）模块。本文使用了F+U个Transformer层：

在前F层中，Attention参数冷冻，只训练Layer Norm
在后U层中，Attention参数也用于训练
经过F+U个Transformer层后，得到的 $H^{F+U}$ 后，使用一个Regression Conv获得最终结果：
$Y_S = RegressionConv(H^{F+U}) \isin R^{S*N}.$

实验

交通预测

在这里插入图片描述

从这个实验结果来看，看起来很多后来的方法都比不上DCRNN？？？

效率

在这里插入图片描述

小样本/零样本（大模型必备）

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/377068.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

PGCCC|【PostgreSQL】PCP认证考试大纲#postgresql 认证

PGCCC|【PostgreSQL】PCP认证考试大纲#postgresql 认证

PostgreSQL Certified Professional PCP（中级） PCP目前在市场上非常紧缺，除了具备夯实的理论基础以外，要有很强的动手能力，获得“PCP（中心）“的学员，将能够进入企业的生产系统进行运…

阅读更多...

c#中的特性

c#中的特性

在C#中，特性（Attributes）是一种向程序元素（如类、方法、属性等）添加元数据的方式。特性可以用来提供关于程序元素的附加信息，这些信息可以在编译时和运行时被访问。特性主要有以下几个用途： 提…

阅读更多...

《C专家编程》 C++

《C专家编程》 C++

抽象就是观察一群数据，忽略不重要的区别，只记录关注的事务特征的关键数据项。比如有一群学生，关键数据项就是学号，身份证号，姓名等。 class student {int stu_num;int id_num;char name[10]; } 访问控制 this关键字…

阅读更多...

DDColor - 黑白老照片一键AI上色工具，找回“失色“的记忆，老照片一键“回春” 本地一键整合包下载

DDColor - 黑白老照片一键AI上色工具，找回“失色“的记忆，老照片一键“回春” 本地一键整合包下载

DDColor 是一个由阿里达摩院研究的基于深度学习技术的图像上色模型，主要用于黑白照片的修复和上色。它能够自动将黑白或灰度图像着色，使图像更加生动逼真。该模型采用了先进的神经网络架构和训练技术，能够识别图像中的物体和场景&#xf…

阅读更多...

[MySQL][表的约束][二][主键][自增长][唯一键][外键]详细讲解

[MySQL][表的约束][二][主键][自增长][唯一键][外键]详细讲解

目录 1.主键2.自增长1.是什么？2.索引 3.唯一键4.外键1.为什么？2.是什么？3.如何理解外键约束？ 5.综合案例 -- 阅读 1.主键主键：primary key用来唯一的约束该字段里面的数据，不能重复，不能为空&a…

阅读更多...

vscode编译环境配置-golang

vscode编译环境配置-golang

1. 支持跳转如果单测函数上方不显示run test | debug test，需要安装Code Debugger（因为以前的go Test Explorer不再被维护了） 2. 单测指定单个用例测试 go test -v run TestXXXdlv 调试需要安装匹配的go版本和delve版本（如…

阅读更多...

AirSim环境配置

AirSim环境配置

AirSim简介 AirSim 是一款基于游戏引擎的开源跨平台仿真器，它可以用于无人机、无人车等机器人的物理和视觉仿真。它同时支持基于 PX4 和 ArduPilot 等飞行控制器的软件在环仿真，目前还支持基于PX4的硬件在环仿真。AirSim 是作为虚幻游戏引擎的插件而存在的，适配基于虚幻引擎…

阅读更多...

负载均衡-轮询-两种简易实现

负载均衡-轮询-两种简易实现

1、描述下游可用的服务器目前有5个（node），设计一个方法，方法没有任何参数，采用轮询的方式返回其中一个node； 2、使用环形链表每次取下一个node即可。注意：需要保证线程安全！ // …

阅读更多...

子数组问题

子数组问题

目录最大子数组和环形子数组的最大和乘积最大子数组乘数为正数的最长子数组长度等差数列划分最长湍流子数组单词拆分环绕字符串中唯一的子字符串声明：接下来主要使用动态规划来解决问题！！！ 最大子数组和题目 …

阅读更多...

C 语言指针进阶

C 语言指针进阶

1.0 指针的定义指针是内存中一个最小单元的编号（内存单元的编号称之为地址【地址就是指针指针就是地址】）指针通常是用来存放内存地址的一个变量。本质上指针就是地址：口语上说的指针起始是指针变量，指针变量就是一个变量&#…

阅读更多...

ROS2从入门到精通5-1：详解代价地图与costmap插件编写(以距离场ESDF为例)

ROS2从入门到精通5-1：详解代价地图与costmap插件编写(以距离场ESDF为例)

目录 0 专栏介绍1 代价地图介绍1.1 基本概念1.2 代价定义 2 代价地图配置2.1 通用配置2.2 障碍层配置2.3 静态层配置2.4 膨胀层配置 3 代价地图插件案例3.1 构造地图插件类3.2 注册并导出插件3.3 编译与使用插件 0 专栏介绍本专栏旨在通过对ROS2的系统学习，掌握RO…

阅读更多...

GIT使用_提交IDEA代码到GIT分支上

GIT使用_提交IDEA代码到GIT分支上

以下是本人常用的GIT提交与上传代码，请选择适配自己的方式，仅供参考。第一步，一般来说，我们从GIT上拉下来项目分支代码后，做些修改什么的，相关的代码都会变色。当然我们提交的部分就是我们修改的部分。有的…

阅读更多...

算法思想总结：字符串

算法思想总结：字符串

一、最长公共前缀 . - 力扣（LeetCode） 思路1：两两比较时间复杂度mn 实现findcomon返回两两比较后的公共前缀 class Solution { public:string longestCommonPrefix(vector<string>& strs) {//两两比较 string retstrs[0];size…

阅读更多...

Flutter实现局部刷新的几种方式

Flutter实现局部刷新的几种方式

目录前言 1.局部刷新的重要性 1.概念 2.重要性 2.局部刷新实现的几种方式 1.使用setState方法进行局部刷新 2.使用StatefulWidget和InheritedWidget局部刷新UI 3.ValueNotifier和ValueListenableBuilder 4.StreamBuilder 5.Provider 6.GetX 7.使用GlobalKey 前言 …

阅读更多...

实战：功能强大齐全BBS论坛项目Echo简介

实战：功能强大齐全BBS论坛项目Echo简介

项目简介 Echo 是一套前后端不分离的开源社区系统，基于目前主流 Java Web 技术栈（SpringBoot MyBatis MySQL Redis Kafka Elasticsearch Spring Security ...），并提供详细的开发文档和配套教程。包含帖子、评论、私信、系…

阅读更多...

HarmonyOS NEXT：一次开发，多端部署

HarmonyOS NEXT：一次开发，多端部署

寄语这几年特别火的uni-app实现了“一次开发，多端使用”，它这个端指的是ios、安卓、各种小程序这些，而HarmonyOS NEXT也提出了“一次开发，多端部署”，而它这个端指的是终端设备，也就是我们的手机、平板、电…

阅读更多...

记录些MySQL题集（2）

记录些MySQL题集（2）

MySQL 不使用limit的分页查询 limit问题：limit，offset递增问题。随着offset的增加，条数不变，耗时却增加了。 limit 0,10 耗时1ms limit 300000,10 耗时152ms limit 600000,10 耗时312ms 毫秒级别可能没感觉。假…

阅读更多...

gitlab 搭建使用

gitlab 搭建使用

1. 硬件要求 ##CPU 4 核心500用户 8 核心1000用户 ##内存 4 G内存500用户 8 G内存1000用户 2. 下载链接 3. 安装依赖 yum -y install curl openssh-server postfix wget 4. 安装gitlab组件 yum -y localinstall gitlab-ce-15.9.3-ce.0.el7.x86_64.rpm 5. 修改配置文…

阅读更多...

使用Python的Turtle模块绘制小猪佩奇

使用Python的Turtle模块绘制小猪佩奇

引言在编程学习中，Turtle是一个非常有趣且实用的模块，尤其适合初学者。它允许用户通过控制一个可以在屏幕上移动的小海龟来绘制图形，从而直观地理解坐标、角度和循环等概念。本篇博客将介绍如何使用Python的Turtle模块来绘制一个可爱的卡通…

阅读更多...

PostgreSQL日志文件配置，记录所有操作记录

PostgreSQL日志文件配置，记录所有操作记录

为了更详细的记录PostgreSQL 的运行日志，我们一般需要修改PostgreSQL 默认的配置文件，这里整理了一些常用的配置修改配置文件打开 PostgreSQL 配置文件 postgresql.conf。该文件通常位于 PostgreSQL 安装目录下的 data 文件夹中。找到并修改以下配…

阅读更多...

最新文章

推荐文章