多元时间序列预测的范式革命:从数据异质性到基准重构

本推文介绍了一篇来自中国科学院计算技术研究所等机构的论文《Exploring Progress in Multivariate Time Series Forecasting: Comprehensive Benchmarking and Heterogeneity Analysis》,发表在《IEEE Transactions on Intelligent Transportation Systems》。论文针对多变量时间序列(MTS)预测中实验结果不一致、技术方向选择困难等问题,提出了首个专门为MTS预测设计的基准框架BasicTS+,通过统一训练流程和评估标准,实现了45种模型在20个数据集上的公平对比。

研究首次揭示了MTS数据集的异质性特征,根据时间序列的稳定性和空间依赖程度将数据集分为三大类,并发现模型性能与数据特征密切相关:例如Transformer模型在具有稳定周期模式的数据集上表现优异,而简单线性模型在分布漂移或无明确模式的数据中更具优势。实验结果表明,现有模型的有效性高度依赖数据类型,盲目套用结论可能导致误判。该研究不仅为MTS预测提供了可靠的评估工具,还为模型选择和数据集设计提供了理论依据,为复杂系统如交通、能源领域的时间序列分析奠定了方法论基础。

论文链接https://ieeexplore.ieee.org/abstract/document/10726722

代码与数据集https://github.com/GestaltCogTeam/BasicTS

一、 领域困境:实验结果为何"打架"?

在交通、能源等复杂系统的智能决策中,多元时间序列(MTS)预测扮演着核心角色。然而,当前研究存在两大痛点:

(1)结论矛盾:同一模型在不同研究中表现差异显著(如DCRNN在PEMS04的MAE波动达33%)

(2)方法困惑:Transformer与线性模型的优劣之争持续数年,STGNN的必要性饱受质疑

中国科学院计算技术研究所团队在《IEEE Transactions on Knowledge and Data Engineering》发表的最新研究,首次系统性揭示了这些矛盾背后的根本原因——数据异质性,并构建了首个公平可比的基准框架BasicTS+。

二、 核心突破:BasicTS+基准框架

2.1 BasicTS+框架及基本流程

1展示了BasicTS+的框架,其中主要包括BasicTS+的核心组件和用户配置文件两部分。

1 BasicTS+的框架

BasicTS+框架的基本流程如下:

(1)数据预处理:强制Z-score归一化,自动添加时间戳、星期几等10+外部特征

(2)训练策略:采用掩码MAE失函数,整合课程学习与梯度裁剪技术

(3)评估标准:提供MAE/RMSE/MAPE/WAPE8维度指标,支持归一化与反归一化双重验证

通过标准化数据加载、训练运行与评估流程,BasicTS+实现了45种模型在20个数据集上的公平对比。实验显示,统一标准使模型性能平均提升25%,消除了因实验设置差异导致的误判。

2.2 数据异质性分类体系

研究首次提出MTS数据的双维度分类标准:

(1)图2展示了以时间特征维度MTS数据的分类标准,为稳定周期模式、分布漂移模式和无明确模式,分别对应PEMS03/04/08、ETTh2/ETTm2和ExchangeRate典型数据集。

2 多个MTS数据集中的不同时间模式

(2)图3展示了以空间特征维度MTS数据的分类标准,为高不可区分性、低不可区分性,分别对应METR-LA/BAY、ETTm1/ETTm2典型数据集。

不同数据集中的空间不可区分性

三、颠覆性发现:数据决定模型命运

3.1 时间维度的"模型适配法则"

1)稳定周期数据:表1中可以看出,Transformer架构(如FEDformer)通过捕捉多尺度周期性,在PEMS04的MAE达26.89,较线性模型低39.49%

2)分布漂移数据:表1中可以看出,线性模型(DLinear)因抗过拟合能力,在ETTh2的MAE仅3.13,优于Transformer的3.27

3)无明确模式数据:所有模型性能相近,凸显预测本质困难

高级模型和基线模型在异构MTS数据集中的性能

3.2 空间维度的"建模边界"

(1)高不可区分性数据:表2中可以看出,STID通过空间身份嵌入,在METR-LA的MAE达3.12,较移除空间模块的STID*降低12.85%

(2)低不可区分性数据:表2中可以看出,保留GCN的AGCRN在ETTm1的MAE反而比AGCRN*高21.16%

2 STIDAGCRN及其变体在具有不同空间不可区分性的数据集上的性能

表2呈现了STID、AGCRN及其变体在不同空间不可区分性数据集上的性能差异:在空间不可区分性高的LA、BAY数据集中,含空间依赖模块的STID、AGCRN表现更优;而在空间不可区分性低的ER、ETTm1数据集中,去掉空间模块的变体(STID*、AGCRN*)性能更突出,如ER数据集MAPE指标中,变体较原模型下降25.31%。Gap数据进一步表明,空间依赖模块在低空间不可区分性数据集中会导致性能损失,验证了研究中“模型空间建模需适配数据空间异质性”的结论——高空间不可区分性数据适合依赖空间模块的模型,低空间不可区分性数据无需复杂空间建模,凸显模型与数据空间特征适配的关键作用。

四、实践指南:模型选择路线图

图4 多元时间序列(MTS模型选择路线图

(1)时间维度判断:首先分析数据是否具有稳定周期性。若有,直接选用Transformer/STGNN模型;

(2)进一步细分:如果数据无稳定周期,接着判断是否属于分布漂移型。若是,适配线性模型+动态调整方案;

(3)最终判定:如果数据既无稳定周期,也非分布漂移(即无明确模式),则采用简单模型+不确定性估计的组合。

整个流程环环相扣,基于数据时间特征层层筛选,确保模型与数据特性精准匹配。

五、未来展望:从"模型竞赛"到"数据理解"

该研究带来三大启示:

(1)数据特征优先:复杂模型的有效性高度依赖数据模式,盲目追求架构创新可能适得其反

(2)基准重构意义:BasicTS+为领域提供了可复现的评估标准,推动研究从"黑箱竞赛"转向科学验证

(3)应用转化路径:在智慧交通、能源调度等场景,应先进行数据特征诊断,再匹配模型架构

这项研究不仅为多元时间序列预测建立了新的方法论框架,更深刻揭示了AI模型与数据本质的相互作用规律。当我们在赞叹Transformer的强大时,或许更应关注数据背后跳动的"脉搏"——毕竟,真正的智能,始于对数据的敬畏与理解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/35587.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开源PACS(dcm4che-arc-light)部署教程,源码方式

目录 文件清单下载地址安装概述OpenLDAP、Apache Directory StudioWildflydcm4che 安装部署MySQL源码编译dcm4cheedcm4chee-arc-light OpenLDAP安装ApacheDirectoryStudio安装配置WildFly服务器 部署完成 文件清单 下载地址 Apache directory studio - linkOpenLDAP - linkdcm…

PySide(PyQt),使用types.MethodType动态定义事件

以PySide(PyQt)的图片项为例,比如一个视窗的场景底图是一个QGraphicsPixmapItem,需要修改它的鼠标滚轮事件,以实现鼠标滚轮缩放显示的功能。为了达到这个目的,可以重新定义一个QGraphicsPixmapItem类,并重写它的wheelE…

深度学习 Deep Learning 第1章 深度学习简介

第1章 深度学习简介 概述 本章介绍人工智能(AI)和深度学习领域,讨论其历史发展、关键概念和应用。解释深度学习如何从早期的AI和机器学习方法演变而来,以及如何有效解决之前方法无法应对的挑战。 关键概念 1. 人工智能的演变 …

简述下npm,cnpm,yarn和pnpm的区别,以及跟在后面的-g,--save, --save-dev代表着什么

文章目录 前言一、npm,cnpm,yarn和pnpm的基本介绍和特点1.npm (Node Package Manager)2. Yarn3. cnpm (China npm)4. pnpm 二、简述npm和pnpm 的存储方式和依赖数1.存储方式2.依赖树 三、两者依赖树的差异导致结果的对比四、简单说说-g,--sav…

vue3系列:vite+vue3怎么配置通过ip和端口打开浏览器

目录 1.前言 2.修改前的 3.修改后的 4.效果 5.其他 1.前言 想要使用IP端口号的方式访问页面,结果无法访问 查了些资料,原来是vite.config.js需要加一些配置才能让他通过IP访问,默认的只能localhost:端口号访问 2.修改前的 使用vue3默认…

使用yolov8+flask实现精美登录界面+图片视频摄像头检测系统

这个是使用flask实现好看登录界面和友好的检测界面实现yolov8推理和展示,代码仅仅有2个html文件和一个python文件,真正做到了用最简洁的代码实现复杂功能。 测试通过环境: windows x64 anaconda3python3.8 ultralytics8.3.81 flask1.1.2…

突破连接边界!O9201PM Wi-Fi 6 + 蓝牙 5.4 模块重新定义笔记本无线体验

在当今数字化时代,笔记本电脑已成为人们工作、学习和娱乐的必备工具。而无线连接技术,作为笔记本电脑与外界交互的关键桥梁,其性能的优劣直接关乎用户体验的好坏。当下,笔记本电脑无线连接领域存在诸多痛点,严重影响着…

2025 香港 Web3 嘉年华:全球 Web3 生态的年度盛会

自 2023 年首届香港 Web3 嘉年华成功举办以来,这一盛会已成为全球 Web3 领域规模最大、影响力最深远的行业活动之一。2025 年 4 月 6 日至 9 日,第三届香港 Web3 嘉年华将在香港盛大举行。本届活动由万向区块链实验室与 HashKey Group 联合主办、W3ME 承…

Windows11 新机开荒(二)电脑优化设置

目录 前言: 一、注册微软账号绑定权益 二、此电脑 桌面图标 三、系统分盘及默认存储位置更改 3.1 系统分盘 3.2 默认存储位置更改 四、精简任务栏 总结: 前言: 本文承接上一篇 新机开荒(一) 上一篇文章地址&…

[C++面试] 标准容器面试点

一、入门 1、vector和list的区别 [C面试] vector 面试点总结 vector 是动态数组,它将元素存储在连续的内存空间中。支持随机访问,即可以通过下标快速访问任意位置的元素,时间复杂度为 O(1),准确点是均摊O(1)。但在中间或开头插…

蓝桥杯每日一题

丢失的雨伞 题目思路代码演示 题目 今天晚上本来想练习一下前缀和与差分 结果给我搜出来这题(几乎没啥关系),我看半天有点思路但又下不了手哈哈,难受一批 在图书馆直接红温了 题目链接 思路 题目要求找到两个不重叠的区间&…

校园安全用电怎么保障?防触电装置来帮您

引言 随着教育设施的不断升级和校园用电需求的日益增长,校园电力系统的安全性和可靠性成为了学校管理的重要课题。三相智能安全配电装置作为一种电力管理设备,其在校园中的应用不仅能够提高电力系统的安全性,还能有效保障师生的用电安全&am…

Matlab 汽车二自由度转弯模型

1、内容简介 Matlab 187-汽车二自由度转弯模型 可以交流、咨询、答疑 2、内容说明 略 摘 要 本文前一部分提出了侧偏角和横摆角速度作为参数。描述了车辆运动的运动状态,其中文中使用的参考模型是二自由度汽车模型。汽车速度被认为是建立基于H.B.Pacejka的轮胎模…

OpenCV计算摄影学(20)非真实感渲染之增强图像的细节函数detailEnhance()

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 此滤波器增强特定图像的细节。 cv::detailEnhance用于增强图像的细节,通过结合空间域和频率域的处理,提升图像中特定细节…

Java面试八股—Redis篇

一、Redis的使用场景 (一)缓存 1.Redis使用场景缓存 场景:缓存热点数据(如用户信息、商品详情),减少数据库访问压力,提升响应速度。 2.缓存穿透 正常的访问是:根据ID查询文章&…

2025-03-17 Unity 网络基础1——网络基本概念

文章目录 1 网络1.1 局域网1.2 以太网1.3 城域网1.4 广域网1.5 互联网(因特网)1.6 万维网1.7 小结 2 IP 地址2.1 IP 地址2.2 端口号2.3 Mac 地址2.4 小结 3 客户端与服务端3.1 客户端3.2 服务端3.3 网络游戏中的客户端与服务端 1 网络 ​ 在没有网络之前…

【工业现场总线】控制网络的主要特点是?OSI参考模型的分层是?

目录 1、控制网络的主要特点? 2、网络拓扑结构的主要类型?其各自主要特点是什么? 3、网络的传输介质主要有什么? 4、网络传输介质的访问控制方式主要有哪些?其各自主要特点是什么? 5、OSI参考模型的分…

微软开源神器OmniParser V2.0 介绍

微软开源的OmniParser V2.0是一款基于纯视觉技术的GUI智能体解析工具,旨在将用户界面(UI)截图转换为结构化数据,从而实现对计算机屏幕上的可交互元素的高效识别和操控。这一工具通过结合先进的视觉解析技术和大型语言模型&#xf…

用python代码将excel中的数据批量写入Json中的某个字段,生成新的Json文件

需求 需求: 1.将execl文件中的A列赋值给json中的TrackId,B列赋值给json中的OId 要求 execl的每一行,对应json中的每一个OId json 如下: {"List": [{"BatchNumber": "181-{{var}}",// "Bat…

实验篇| Nginx环境搭建-安全配置

在前面的文章里,阿祥详细介绍了在 Windows 系统中安装 Nginx 服务器的具体操作步骤,感兴趣的朋友可以参考:实验篇 | Nginx 反向代理 - 7 层代理 。完成 Nginx 的安装只是搭建 Web 服务的第一步,为了保障服务器的稳定运行以及数据安…