时序论文28|CycleNet:通过对周期模式进行建模增强时间序列预测

图片

论文标题:CycleNet: Enhancing Time Series Forecasting through Modeling Periodic Patterns

论文链接:https://arxiv.org/abs/2409.18479v1

代码链接:https://github.com/ACAT-SCUT/CycleNet

前言

这是今年NIPS的一篇时序论文,主要是提出了一种通过对周期模式进行建模来提高时间序列预测性能的方法。很明显,论文潜在的应用领域是那些具有周期模式的数据。这是一种很好的思路,就是把应用方向限制在具体问题上。时间序列领域有很多问题,比如:平稳性、周期性、长/短预测、趋势分解等等,一个模型肯定不能适应所有数据,解决所有问题,那么我就把问题定义清楚,只解决我定义的问题。

这里其实有个潜在的argue点,就是审稿人可能会觉得这样的论文应用面有限,一个回避的策略是:在论文中对结果做定量分析,解释本文方法为什么,并对其局限性和未来研究方向进行了讨论,这样相当于间接堵住审稿人的嘴。

研究背景

长周期预测的关键在于理解数据中的周期性,实际上就是发现数据的周期模式。像 Informer、Autoformer和 PatchTST 这类模型属于借助了Transformer 的长距离建模能力。ModernTCN 采用大卷积核来增强 TCN(时间卷积网络)捕捉长距离依赖关系的能力,而 SegRNN使用分段迭代来改进 RNN方法对长序列的处理。

图片

但这里就自然引出了一个问题,以上所有复杂模型的目的就是为了从长距离依赖关系中提取周期性特征,那为何不直接设计简单模型对模式进行建模呢?如图是电力数据,呈现出明显的日周期性模式。我们可以使用一个全局共享的每日片段来表示电力消耗中的周期性模式。通过将这个每日片段重复 N 次,我们就可以连续地表示 N 天电力消耗序列的循环组件。

本文模型

本文对数据中的周期性模式进行显式建模,提出了残差周期预测(RCF)技术。该技术包括使用可学习的循环周期来显式地对时间序列数据中的固有周期性模式进行建模,然后对建模后的周期的残差分量进行预测。将 RCF 技术与单层线性层或双层 MLP(多层感知机)相结合,就得到了 CycleNet。

RCF 技术包括两个步骤:第一步是通过独立通道内的可学习循环周期对序列的周期性模式进行建模,第二步是预测建模后的周期的残差分量。

图片

周期性模式建模:对于具有先验周期长度为 W 的 D 个通道的数据,首先生成可学习的循环周期 Q,其形状为 R^(W×D),且初始值全部为零。作者设置不同通道内是全局共享的,通过进行循环复制,可以得到与序列 X 长度相同的循环分量 C。长度为 W 的这些循环周期 Q 会和用于预测的主干模块一起进行梯度反向传播训练,从而产生不同于初始零值的学习表示,这种学习表示能够揭示出序列内部的循环模式。(我的一些想法:这里有改进空间,因为不同通道周期模式出现是有先后顺序的,这里就可以有一个对齐的过程!)

图片

残差预测:在第一步周期性模式建模后,残差预测针对建模后的周期的残差分量进行预测。具体而言,假设得到序列的循环分量和原始时间序列数据,先计算残差,残差包含时间序列中不能被周期性循环解释的部分。然后使用预测模块(如线性层或浅层 MLP)根据残差的过去观测值预测未来步的残差。最后将预测的残差部分与通过循环周期建模得到的未来循环分量相加,得到最终的时间序列预测结果。

本文实验

图片

图片

挺长的分析和巨长的附录,感兴趣的可以看看。

一些改进点

我觉得这篇论文改进空间挺大,比如:周期长度的确定依赖先验特征且需根据具体数据集手动设置最大稳定周期;通过自相关函数检查数据集周期的方法可能存在一定局限性,不一定能完全准确地确定周期。

可以考虑如何更智能的自动确定最优周期长度,减少对先验知识的依赖;优化残差预测模块,提升对复杂时间序列中残差部分的预测能力,从而提高整体预测的精度。还有,由于是通道独立且共享参数,对不同特征进行对齐也可以考虑!


大家可以关注我【科学最top】,第一时间follow时序高水平论文解读!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/481566.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自动化运维(k8s)之微服务信息自动抓取:namespaceName、deploymentName等全解析

前言:公司云原生k8s二开工程师发了一串通用性命令用来查询以下数值,我想着能不能将这命令写成一个自动化脚本。 起初设计的 版本一:开头加一条环境变量,执行脚本后,提示输入:需要查询的命名空间&#xff0c…

如何把产品3D模型放到网站上进行3D展示或3D互动?

要将产品3D模型放到网站上进行3D展示或3D互动,可以按照以下步骤进行: 一、准备3D模型 使用3D建模软件(如3ds Max、Maya、Blender、C4D等)制作好产品的3D模型。 确保3D模型的格式是网站或平台所支持的,常见的格式包括…

ESP32驱动PCM5102A播放SD卡音频

文章目录 简介模块参数功能框图引脚定义通信接口和通信数据格式通信流程引脚接线ESP32和PCM5102AESP32和SD模块 主要代码spi.hSD.hAudio.h实验效果总结 简介 PCM5102A模块是一款立体声DAC模块、音频数模转换器,内部集成了PCM5102芯片。PCM5102芯片是集成了立体声模…

【人工智能】Python常用库-TensorFlow常用方法教程

TensorFlow 是一个广泛应用的开源深度学习框架,支持多种机器学习任务,如深度学习、神经网络、强化学习等。以下是 TensorFlow 的详细教程,涵盖基础使用方法和示例代码。 1. 安装与导入 安装 TensorFlow: pip install tensorflow…

【设计模式系列】解释器模式(十七)

一、什么是解释器模式 解释器模式(Interpreter Pattern)是一种行为型设计模式,它的核心思想是分离实现与解释执行。它用于定义语言的文法规则,并解释执行语言中的表达式。这种模式通常是将每个表达式抽象成一个类,并通…

【查询目录】.NET开源 ORM 框架 SqlSugar 系列

.NET开源 ORM 框架 SqlSugar 系列 【开篇】.NET开源 ORM 框架 SqlSugar 系列【入门必看】.NET开源 ORM 框架 SqlSugar 系列【实体配置】.NET开源 ORM 框架 SqlSugar 系列【Db First】.NET开源 ORM 框架 SqlSugar 系列【Code First】.NET开源 ORM 框架 SqlSugar 系列【数据事务…

设计模式:11、迭代器模式(游标)

目录 0、定义 1、迭代器模式的四种角色 2、迭代器模式的UML类图 3、示例代码 4、迭代器的next()方法与集合的get(int index)方法的效率对比(LinkedList为例) 0、定义 提供一种方法顺序访问一个聚合对象中的各个元素,而又不需要暴露该对象…

Web开发基础学习——通过React示例学习模态对话框

Web开发基础学习系列文章目录 第一章 基础知识学习之通过React组件学习模态对话框 文章目录 Web开发基础学习系列文章目录前言一、创建新的 React 应用二、 创建模态对话框组件三、修改 App.js四、 添加样式五、启动应用六、访问应用总结 前言 模态对话框(Modal D…

Unity XR Interaction Toolkit 开发教程:抓取交互【3.0以上版本】

获取完整课程以及答疑,工程文件下载: https://www.spatialxr.tech/ Unity XR Interaction Toolkit 系统化开发教程:https://www.spatialxr.tech/course/5 视频说明链接:抓取交互课程介绍【全球最新 Unity VR 系统化入门开发教程…

科技为翼 助残向新 高德地图无障碍导航规划突破1.5亿次

今年12月03日是第33个国际残疾人日。在当下科技发展日新月异的时代,如何让残障人士共享科技红利、平等地参与社会生活,成为当前社会关注的热点。 中国有超过8500万残障人士,其中超过2400万为肢残人群,视力障碍残疾人数超过1700万…

OGRE 3D----4. OGRE和QML共享opengl上下文

在现代图形应用开发中,OGRE(Object-Oriented Graphics Rendering Engine)和QML(Qt Modeling Language)都是非常流行的工具。OGRE提供了强大的3D渲染能力,而QML则用于构建灵活的用户界面。在某些应用场景中,我们需要在同一个应用程序中同时使用OGRE和QML,并且共享OpenGL…

YOLOv9改进,YOLOv9引入TransNeXt中的ConvolutionalGLU模块,CVPR2024,二次创新RepNCSPELAN4结构

摘要 由于残差连接中的深度退化效应,许多依赖堆叠层进行信息交换的高效视觉Transformer模型往往无法形成足够的信息混合,导致视觉感知不自然。为了解决这个问题,作者提出了一种聚合注意力(Aggregated Attention),这是一种基于仿生设计的token混合器,模拟了生物的中央凹…

坐标系变换

1 Clark变换 三相对称电压表达式为: 将三相电压用相量的形式表达出来,并用欧拉公式(eix(cosxisinx))写成三角函数的形式: 同时,三相电压矢量空间合成向量可表示为: 三相电压合成矢量幅值为相电…

Java 上机实践10(常用实用类)

(大家好,今天分享的是Java的相关知识,大家可以在评论区进行互动答疑哦~加油!💕) 目录 Plug:程序实现方法一(记事本) 方法二(IDEA) 实验一&…

【JavaEE初阶 — 网络编程】Socket 套接字 & UDP数据报套接字编程

1. Socket套接字 1.1 概念 Socket 套接字,是由系统提供用于网络通信的技术,是基于TCP / IP协议的网络通信的基本操作单元。基于 Socket 套接字的网络程序开发就是网络编程。 1.2 分类 Socket套接字主要针对传输层协议划分为如下三类&#x…

MacOS 如何连接 Linux NFS 服务器

以 Ubuntu 为例。 Ubuntu 服务器端设置 1. 进入 root 权限,安装 NFS 服务: apt-get update apt-get install nfs-kernel-server2. 创建共享目录: mkdir /data chown nobody:nogroup /data chmod 777 /data3. 配置 /etc/exports 文件: vi …

23种设计模式-原型(Prototype)设计模式

文章目录 一.什么是原型设计模式?二.原型模式的特点三.原型模式的结构四.原型模式的优缺点五.原型模式的 C 实现六.原型模式的 Java 实现七. 代码解析八.总结 类图: 原型设计模式类图 一.什么是原型设计模式? 原型模式(Prototype…

Docker Buildx 与 CNB 多平台构建实践

一、Docker Buildx 功能介绍 docker buildx 是 Docker 提供的一个增强版构建工具,支持更强大的构建功能,特别是在构建多平台镜像和高效处理复杂 Docker 镜像方面。 1.1 主要功能 多平台构建支持 使用 docker buildx,可以在单台设备上构建…

C# 数据类型详解:掌握数据类型及操作为高效编码奠定基础

本文将带你深入了解C#中各种数据类型的特点、用途和最佳实践,让你不仅能熟练运用基本类型,还能掌握如何在实际项目中做出最合适的选择。 目录 C#基本语法 C#数据类型 C#类型转换 C#变量常量 C#基本语法 在学习C#之前我们要先知道C#的基础构建是由哪些…

新型大语言模型的预训练与后训练范式,谷歌的Gemma 2语言模型

前言:大型语言模型(LLMs)的发展历程可以说是非常长,从早期的GPT模型一路走到了今天这些复杂的、公开权重的大型语言模型。最初,LLM的训练过程只关注预训练,但后来逐步扩展到了包括预训练和后训练在内的完整…