基于视觉智能的时间序列基础模型

图片

GitHub链接:ViTime: A Visual Intelligence-Based Foundation Model for Time Series Forecasting

论文链接:https://github.com/IkeYang/ViTime

前言

作者是来自西安理工大学,西北工业大学,以色列理工大学以及香港城市大学的研究者。

1. 研究动机:

近年来,深度学习模型在特定数据集上表现优异,但它们往往需要大量的领域特定数据进行训练,缺乏跨域泛化能力。这一挑战促使研究人员开始探索构建基础模型(Foundation Model)的可能性,以期望通过预训练获得通用的时间序列理解能力,进而实现跨域零样本(Zero-shot)或少样本(Few-shot)学习。

然而,现有的TSF基础模型面临着两个重大挑战:

1) 数值建模的局限性:

现有的TSF模型,包括基础模型,主要关注于直接拟合数值时间序列数据。这意味着这些模型的主要信息载体是时间维度上的数值关系。然而,人类在观察和预测趋势时,往往更倾向于通过视觉表征来理解数据,而非直接处理原始数值。

研究表明,人脑在处理视觉信息方面远比处理数值数据更为高效。人脑在处理视觉信息时的效率显著高于处理数值数据,并且视觉皮层能够快速识别模式、形状和颜色,使得图像和视频的处理速度远快于文本和数字。这些发现自然而然地引发了一个假设性问题:在通往人工通用智能(AGI)的道路上,采用视觉智能方法进行时间序列建模是否会比传统的数值方法更加有效?

2) 训练数据的局限性:

目前的基础模型训练数据通常由大规模实际世界数据集构成。这引发了一个关键问题:这些大规模实际数据集是否能全面捕捉普适时间序列模式的多样性?换言之,一个真正通用的时间序列基础模型应具备何种基本能力,才能应对广泛的时间序列问题?

为了应对这些挑战,作者提出了一种创新的视觉智能基础模型 ViTime(Visual Time Foundation Model)。ViTime旨在从视觉智能的角度开创时间序列基础模型研究的新范式。此外,作者还引入了一种新颖的时间序列数据生成方法 RealTS(Real Time Series),该方法将时间序列分析的基础知识归类为"趋势"和"周期性",并在ViTime的训练过程中合成训练数据。ViTime的核心思想是将数值时间序列转换为二值图像,从而将数值时间相关性转化为二值像素空间相关性。这种方法与人脑处理时间序列数据的方式高度契合。大量实验结果表明,当应用于各种未见过的跨域数据集时,所提出的ViTime模型能够达到最先进的零样本性能,在某些情况下甚至超越了最佳的单独训练的监督模型。更值得注意的是,只需使用10%的领域数据进行微调,ViTime就能够在性能上超越使用100%领域数据的最新监督模型。

研究方法

ViTime的研究方法包括几个关键创新,下面我们将详细介绍每个组成部分:

a) 视觉表征:

ViTime的核心创新在于将数值时间序列转换为二值图像。这一转换过程不仅仅是简单的可视化,而是将时间序列的本质特征编码到视觉空间中。如下图所示。原文包含相应的空间定义函数、映射函数以及相关定理,欢迎大家阅读。

图片

b) 真实时间序列(RealTS)合成:

为了解决现有大规模实际数据集可能无法全面捕捉时间序列多样性的问题,作者提出了RealTS数据生成方法。RealTS的核心思想是将时间序列的基础知识分解为两个关键组成部分:趋势(Trend)和周期性(Periodicity)。其定义了多个时间序列生成模式,采用随机生成方式产生训练数据。

图片

图片

c) 模型架构:

ViTime的模型架构由三个主要模块组成,视觉时间分词器(Visual Time Tokenizer)、解码器(Decoder)以及Refining Module组成:

图片

实验结果

为了更全面地评估模型的泛化能力,作者引入了重新缩放平均绝对误差(Rescale-MAE)和重新缩放均方误差(Rescale-MSE)这两个新的评估指标。这些指标通过在不同时间分辨率下重新缩放测试数据集来评估模型的性能,有效地避免了测试集泄露问题,同时也考察了模型在不同时间尺度下的适应能力。

在零样本学习任务中,ViTime展现出了令人瞩目的性能。与其他领先的模型如TimesFM(由Google Research提出的强大开源时间序列基础模型)相比,ViTime在大多数数据集和预测长度上都取得了显著优势。特别值得注意的是,在某些情况下,ViTime的零样本性能甚至超越了经过充分训练的监督学习模型。表明基于视觉智能的方法在处理时间序列数据时可能具有根本性的优势,能够捕捉到传统数值方法难以识别的模式和特征。

图片

此外作者还进行了一系列微调实验,对比了ViTime与其他最新的监督学习模型在不同数据比例下的性能。结果表面,只使用10%的领域特定数据进行微调,ViTime就能够在性能上超越使用100%数据训练的最新监督模型,如PatchTST、SiMBA和TIMESNET等。

图片

作者结论:基于视觉智能的时序模型可能是通往AGI的最佳选择。


大家可以关注我【科学最top】,第一时间follow时序高水平论文解读!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/473257.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

006.精读《Apache Paimon Docs - Concepts》

文章目录 1. 引言2. 基本概念2.1 基本构成2.2 Schema2.3 Snapshot2.4 Manifest2.5 Data File2.6 Table2.7 File index 3.并发控制3.1 基本概念3.2 快照冲突3.3 文件冲突 4. 总结 1. 引言 在本期的技术深度解析中,我们将学习并且了解Apache Paimon 的基本概念&#…

RedHat7—Linux中kickstart自动安装脚本制作

本实验使用虚拟机版本为rhel7,从rhel7后的版本kickstart工具进行收费使用。 1.在VMware关闭dhcp自动获取ip地址功能 2.安装并启动httpd [rootlocalhost ~]# yum install httpd [rootlocalhost ~]# systemctl start httpd [rootlocalhost ~]#systemctl stop firewal…

数据集的重要性:如何构建AIGC训练集

文章目录 一、为什么数据集对AIGC如此重要?1. 数据决定模型的知识边界2. 数据质量直接影响生成效果3. 数据集多样性提升模型鲁棒性 二、构建AIGC训练集的关键步骤1. 明确目标任务和生成需求2. 数据源的选择3. 数据清洗与预处理4. 数据标注5. 数据增强 三、针对不同类…

结构化需求分析与设计

前言: 感觉书本上和线上课程, 讲的太抽象, 不好理解, 但软件开发不就是为了开发应用程序吗?! 干嘛搞这么抽象,对吧, 下面是个人对于软件开发的看法, 结合我的一些看法, 主打简单易懂, 当然,我一IT界小菜鸟, 对软件开发的认识也很浅显, 这个思维导图也仅仅是现阶段我的看…

docker-hub 无法访问,使用windows魔法拉取docker images再上传到linux docker环境中

云机的服务器是可以docker拉取镜像的,但是本地的虚拟机、物理服务器等网络环境不好的情况,是无法访问docker-hub的,即使更换了docker镜像源国内源也无法使用。 本文章使用 在魔法网络环境下的windows,下载docker images后&#xf…

LlamaIndex+本地部署InternLM实践

1.环境配置 1.1 配置基础环境 这里以在 Intern Studio 服务器上部署 LlamaIndex 为例。 首先,打开 Intern Studio 界面,点击 创建开发机 配置开发机系统 填写 开发机名称 后,点击 选择镜像 使用 Cuda11.7-conda 镜像,然后在资源…

MySql 日期周处理方式

MySql 日期周处理方式 最近在做数仓相关工作,最近遇到 几个问题, 1、计算指定日期是一年中的第几周,周一为周的第一天 2、计算周的开始时间,结束时间 3、计算周对应的年 比如 2023-01-01 WEEKOFYEAR(2023-01-01) 是2022年的52周&…

AI驱动的桌面笔记应用Reor

网友 竹林风 说,已经成功的用 mxbai-embed-large 映射到 text-embedding-ada-002,并测试成功了。不愧是爱折腾的人,老苏还没时间试,因为又找到了另一个支持 AI 的桌面版笔记 Reor Reor 简介 什么是 Reor ? Reor 是一款由人工智…

每日一博 - Java的Shallow Copy和Deep Copy

文章目录 概述创建对象的5种方式1. 通过new关键字2. 通过Class类的newInstance()方法3. 通过Constructor类的newInstance方法4. 利用Clone方法5. 反序列化 Clone方法基本类型和引用类型浅拷贝深拷贝如何实现深拷贝1. 让每个引用类型属性内部都重写clone()方法2. 利用序列化 概述…

Rewar Model的输出(不包含训练)

这里写自定义目录标题 介绍模型推理的输出过程方案原始Token输出RM输出(回归任务) 介绍 奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练&#xff0c…

【操作系统实验课】Makefile与编译

1. 创建项目结构 my_project 使用mkdir命令在根目录下创建项目my_project sudo mkdir /my_project 进入my_project目录 cd my_project src 在my_project目录下创建src子目录 sudo mkdir src 进入src目录 cd src root(根用户) 切换用户身份为root(根用户) root用户…

【H3C华三 】VRRP与BFD、Track联动配置案例

原创 厦门微思网络 组网需求 如图1所示,区域A和区域B用户所在网络的出口处部署了两台汇聚层设备(Device A和Device B)。 现要求使用VRRP与BFD、Track联动功能,实现以下需求: • 在Device A和Device B上分别配置两个…

LeetCode --- 143周赛

题目列表 3345. 最小可整除数位乘积 I 3346. 执行操作后元素的最高频率 I 3347. 执行操作后元素的最高频率 II 3348. 最小可整除数位乘积 II 一、最小可整除数位成绩I 由于本题的数据范围比较小,我们直接暴力枚举即可,代码如下 class Solution { p…

从建立TRUST到实现FAIR:可持续海洋经济的数据管理

1. 引言 随着我们对信息管理方式的信任,我们的社会对数字化数据的以来呈指数级增长。为了跟上大数据的需求,通过不断的努力和持续实践,对“good”数据管理方式的共识也在不断发展和演变。 加拿大正在建设国家基础设施和服务以及研究数据管理…

微服务即时通讯系统的实现(客户端)----(2)

目录 1. 将protobuf引入项目当中2. 前后端交互接口定义2.1 核心PB类2.2 HTTP接口定义2.3 websocket接口定义 3. 核心数据结构和PB之间的转换4. 设计数据中心DataCenter类5. 网络通信5.1 定义NetClient类5.2 引入HTTP5.3 引入websocket 6. 小结7. 搭建测试服务器7.1 创建项目7.2…

SpringBoot集成itext导出PDF

添加依赖 <!-- PDF导出 --><dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.11</version></dependency><dependency><groupId>com.itextpdf</groupId>&l…

[ACTF2020]Upload 1--详细解析

信息收集 题目告诉我们是一道upload&#xff0c;也就是文件上传漏洞题目。 进入界面&#xff0c;是一个灯泡&#xff0c;将鼠标放在图标上就会出现文件上传的相应位置&#xff1a; 思路 文件上传漏洞&#xff0c;先看看有没有前端校验。 在js源码中找到了前端校验&#xff…

针对股票评论的情感分类器

&#x1f3e1;作者主页&#xff1a;点击&#xff01; &#x1f916;编程探索专栏&#xff1a;点击&#xff01; ⏰️创作时间&#xff1a;2024年11月16日13点39分 神秘男子影, 秘而不宣藏。 泣意深不见, 男子自持重, 子夜独自沉。 论文链接 点击开启你的论文编程之旅…

大数据-226 离线数仓 - Flume 优化配置 自定义拦截器 拦截原理 了 拦截器实现 Java

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; Java篇开始了&#xff01; 目前开始更新 MyBatis&#xff0c;一起深入浅出&#xff01; 目前已经更新到了&#xff1a; Hadoop&#xff0…

【工具插件类教学】在 Unity 中使用 iTextSharp 实现 PDF 文件生成与导出

目录 一、准备工作 1. 安装 iTextSharp 2. 准备资源文件 二、创建 ExportPDFTool 脚本 1、初始化 PDF 文件,设置字体 2、添加标题、内容、表格和图片 三、使用工具类生成 PDF 四、源码地址 在 Unity 项目中,我们有时会需要生成带有文本、表格和图片的 PDF 文件,以便…