<论文>时序大模型如何应用于金融领域?

一、摘要

        本文介绍2024年的论文《Financial Fine-tuning a Large Time Series Model》,论文探索了主流的时间序列大模型在金融领域的微调应用实践,为时序大模型的领域微调提供了参考。

84b3d4bc03fb461d8cee72c4452f6c5c.png

译文:

        大型模型在自然语言处理、图像生成以及近期的时间序列预测方面展现出了前所未有的能力。这就引出了一个问题:将市场价格视为时间序列,能否用大型模型来预测市场?在本文中,我们通过评估最新的时间序列基础模型 TimesFM 在价格预测方面的性能来回答这个问题。我们发现,由于价格数据的不规则性,直接应用 TimesFM 效果不佳,并提出针对价格预测任务在金融数据上对 TimesFM 进行微调。这是通过在包含 1 亿个时间点、涵盖不同金融工具且具有小时和日粒度的价格数据上对最新的时间序列基础模型 TimesFM 进行持续预训练来实现的。微调后的模型在价格预测准确性上比基线模型更高。我们在各种金融市场中对模型进行模拟交易,结果表明该模型在收益、夏普比率、最大回撤和交易成本等方面均优于各种基准。

二、核心创新点

        首先,我们需要了解一下论文所使用的时序大模型,即TimesFM。在TimesFM中,输入的时间序列会被加入到长度为eq?input%20%5C_%20patch%20%5C_%20len%20%3D%20l_%7Bi%7D的补丁中,接着由堆叠的多层Transformer层进行处理,从中预测出包含输出补丁长度为eq?l_%7Bo%7D的时间序列。这些预测的结果使用MSE进行评估:

eq?Train_Loss%20%3D%20%5Cfrac%7B1%7D%7BN%7D%20%5Csum_%7Bj%3D1%7D%5E%7BN%7DMSE%28%5Chat%7By%7D_%7Bl_%7Bi%7Dj+1%3Al_%7Bi%7Dj+l_%7Bo%7D%7D%2Cy_%7Bl_%7Bi%7Dj+1%3Al_%7Bi%7Dj+l_%7Bo%7D%7D%29

        TimesFM作者通常将eq?l_%7Bi%7D设置为32,eq?l_%7Bo%7D设置为128,且建议eq?l_%7Bo%7D%3El_%7Bi%7D以仅解码器模式来训练模型。在此基础上,本文作者做出了两处的训练改动。

1e8bedae31c049adacd46456daf8b64f.png

1、损失函数

        作者认为,原始的MSE损失在金融价格数据上进行训练时会存在一系列的缺陷,例如倾向于大规模数值的偏差(平均价值为1000美元的股票指数在训练中的权重会比平均价值为0.0001BUSD的加密货币的权重更大),同时还容易受到市场崩盘事件导致的不稳定性影响。由此,作者对原始时间序列应用一个对数变换,基于变换后的序列来进行预测,再在这些取对数后的序列上计算MSE:

eq?z%20%5Cleftarrow%20log%28y%29

        其中,z作为模型的输入来使用,有:

eq?Train_Loss%20%3D%20%5Cfrac%7B1%7D%7BN%7D%20%5Csum_%7Bj%3D1%7D%5E%7BN%7DMSE%28%5Chat%7Bz%7D_%7Bl_%7Bi%7Dj+1%3Al_%7Bi%7Dj+l_%7Bo%7D%7D%2Cz_%7Bl_%7Bi%7Dj+1%3Al_%7Bi%7Dj+l_%7Bo%7D%7D%29

        对于y的微小变化,计算z=log(y)的MSE等同于计算百分比MSE,而对于y的较大变化,则对数函数的逐渐变缓会导致z的变化小于成比例的变化,从而稳定了训练过程。

2、掩码机制

        作者采用了已有的时序掩码机制,但为了能够随机采样时间序列的起点和重点,进行了以下操作:首先将时间序列分解为长度不超过max_context_length+output_length的序列,然后从[最小上下文长度,最大上下文长度]中随机采样一个eq?t_%7Bend%7D并从[0,eq?t_%7Bend%7D-min_context_length]中再随机采样一个eq?t_%7Bstart%7D。由此,[eq?t_%7Bstart%7Deq?t_%7Bend%7D]中的点就是输入,模型在训练过程中预测后面长度为output_length的时间点并评估损失。

        在上述两个策略下,作者实现了在1小时内完成80M个时间点的TimesFM微调且期间没出现任何的NaN损失。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/1180.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】深入理解文件系统(超详细)

目录 一.磁盘 1-1 磁盘、服务器、机柜、机房 📌补充: 📌通常网络中用高低电平,磁盘中用磁化方向来表示。以下是具体说明: 📌如果有一块磁盘要进行销毁该怎么办? 1-2 磁盘存储结构 ​编辑…

UML系列之Rational Rose笔记七:状态图

一、新建状态图 依旧是新建statechart diagram; 二、工作台介绍 接着就是一个状态的开始:开始黑点依旧可以从左边进行拖动放置: 这就是状态的开始,和活动图泳道图是一样的;只能有一个开始,但是可以有多个…

快速上手 INFINI Console 的 TopN 指标功能

背景 在分布式搜索引擎系统(如 Easysearch、Elasticsearch 和 OpenSearch)中,性能监控至关重要。为了确保系统的高效运行和资源的合理分配,我们通常需要关注一段时间内关键资源的使用情况,特别是索引、节点和分片的内…

springboot vue uniapp 仿小红书 1:1 还原 (含源码演示)

线上预览: 移动端 http://8.146.211.120:8081/ 管理端 http://8.146.211.120:8088/ 小红书凭借优秀的产品体验 和超高人气 目前成为笔记类产品佼佼者 此项目将详细介绍如何使用Vue.js和Spring Boot 集合uniapp 开发一个仿小红书应用,凭借uniapp 可以在h5 小程序 app…

面向对象分析与设计Python版 分析与设计概述

文章目录 一、软件工程概述二、分析与设计概述三、领域模型 一、软件工程概述 高质量软件系统的基本要求 架构性内聚可重用性可维护性可扩展性灵活性 软件开发过程模型:是指根据软件开发项目从开始到结束的一系列步骤和方法,建模为不同的模型。常见的…

3D目标检测数据集——Waymo数据集

Waymo数据集簡介 发布首页:https://waymo.com/open/ 论文:https://openaccess.thecvf.com/content_CVPR_2020/papers/Sun_Scalability_in_Perception_for_Autonomous_Driving_Waymo_Open_Dataset_CVPR_2020_paper.pdf github:https://github.…

[笔记] 使用 Jenkins 实现 CI/CD :从 GitLab 拉取 Java 项目并部署至 Windows Server

随着软件开发节奏的加快,持续集成(CI)和持续部署(CD)已经成为确保软件质量和加速产品发布的不可或缺的部分。Jenkins作为一款广泛使用的开源自动化服务器,为开发者提供了一个强大的平台来实施这些实践。然而…

基于“大型园区”网络设计

基于“大型园区”网络设计 目 录 第1章 项目概述1 1.1 项目背景1 1.2 公司概况1 1.3 网络现状2 第2章 需求分析4 2.1 部门需求4 2.2 配置需求4 2.3 网络功能需求5 第3章 网络设计6 3.1 建设原则6 3.2 网络拓扑结构6 3.3 IP地址和VLAN划分8 3.4 核心层设计9 3.5 …

回归预测 | MATLAB实RVM-Adaboost相关向量机集成学习多输入单输出回归预测

回归预测 | MATLAB实RVM-Adaboost相关向量机集成学习多输入单输出回归预测 目录 回归预测 | MATLAB实RVM-Adaboost相关向量机集成学习多输入单输出回归预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 RVM-Adaboost相关向量机集成学习多输入单输出回归预测是一种先进…

力扣经典练习题之70.爬楼梯

今天继续给大家分享一道力扣的做题心得今天这道题目是70.爬楼梯 题目如下: 题目链接:70.爬楼梯 1,题目分析 这个题目是一个经典的动态规划问题,它帮助我们理解如何通过分解问题来找到解决方案。在现实生活中,很多复杂…

Vue学习二——创建登录页面

前言 以一个登录页面为例子,这篇文章简单介绍了vue,element-plus的一些组件使用,vue-router页面跳转,pinia及持久化存储,axios发送请求的使用。后面的页面都大差不差,也都这么实现,只是内容&am…

ZYNQ初识10(zynq_7010)UART通信实验

基于bi站正点原子讲解视频: 系统框图(基于串口的数据回环)如下: 以下,是串口接收端的波形图,系统时钟和波特率时钟不同,为异步时钟,,需要先延时两拍,将时钟同…

java小知识点总结

一、比特流的本质就是数组 二、位运算 位运算就是CPU的底层原理&#xff0c;半导体电路进行位运算 位运算涉及一些算法&#xff0c;&和^ ^ 异或 两变量交换值&#xff0c;不依赖第三个变量 x^s k 异或知道两者就能推另一个 a a<<2就是乘以2的多少次方 相反 a…

vue3后台系统动态路由实现

动态路由的流程&#xff1a;用户登录之后拿到用户信息和token&#xff0c;再去请求后端给的动态路由表&#xff0c;前端处理路由格式为vue路由格式。 1&#xff09;拿到用户信息里面的角色之后再去请求路由表&#xff0c;返回的路由为tree格式 后端返回路由如下&#xff1a; …

贪心算法笔记

贪心算法笔记 大概内容 贪心就是对于一个问题有很多个步骤,我们在每一个步骤中都选取最优的那一个,最后得出答案。就是在一些函数中可行,但是有些比如二次函数,因为它的转折点不一定最优,就是不可行的。那么如何判断贪心呢?有这么几种 看时间复杂度,一般的就是 O ( n…

CVE-2025-22777 (CVSS 9.8):WordPress | GiveWP 插件的严重漏洞

漏洞描述 GiveWP 插件中发现了一个严重漏洞&#xff0c;该插件是 WordPress 最广泛使用的在线捐赠和筹款工具之一。该漏洞的编号为 CVE-2025-22777&#xff0c;CVSS 评分为 9.8&#xff0c;表明其严重性。 GiveWP 插件拥有超过 100,000 个活跃安装&#xff0c;为全球无数捐赠平…

ubuntu官方软件包网站 字体设置

在https://ubuntu.pkgs.org/22.04/ubuntu-universe-amd64/xl2tpd_1.3.16-1_amd64.deb.html搜索找到需要的软件后&#xff0c;点击&#xff0c;下滑&#xff0c; 即可在Links和Download找到相关链接&#xff0c;下载即可&#xff0c; 但是找不到ros的安装包&#xff0c; 字体设…

细说STM32F407单片机以DMA方式读写外部SRAM的方法

目录 一、工程配置 1、时钟、DEBUG、GPIO、CodeGenerator 2、USART3 3、NVIC 4、 FSMC 5、DMA 2 &#xff08;1&#xff09;创建MemToMem类型DMA流 &#xff08;2&#xff09;开启DMA流的中断 二、软件设计 1、KEYLED 2、fsmc.h、fsmc.c、dma.h、dma.c 3、main.h…

二分查找算法——山脉数组的峰顶索引

一.题目描述 852. 山脉数组的峰顶索引 - 力扣&#xff08;LeetCode&#xff09; 二.题目解析 题目给了我们一个山脉数组&#xff0c;山脉数组的值分布就如下面的样子&#xff1a; 然后我们只需要返回数组的峰值元素的下标即可。 三.算法原理 1.暴力解法 因为题目明确说明…

重塑视频创作的格局!ComfyUI-Mochi本地部署教程

一、介绍 mochi是近期Genmo公司开源的先进视频生成模型&#xff0c;具有高保真运动和强大的提示遵循性。此模型的发布极大的缩小了闭源和开源视频生成系统之间的差距。 目前&#xff0c;视频生成模型与现实之间存在巨大差距。其中最影响视频生成的两个关键功能也就是运动质量和…