基于LSTM与Transfomer的股票预测模型

基于LSTM与Transfomer的股票预测模型

1 项目介绍

股票行情是引导交易市场变化的一大重要因素,若能够掌握股票行情的走势,则对于个人和企业的投资都有巨大的帮助。然而,股票走势会受到多方因素的影响,因此难以从影响因素入手定量地进行衡量。但如今,借助于机器学习,可以通过搭建网络,学习一定规模的股票数据,通过网络训练,获取一个能够较为准确地预测股票行情的模型,很大程度地帮助我们掌握股票的走势。本项目便搭建了**LSTM(长短期记忆网络)**成功地预测了股票的走势。

首先在数据集方面,我们选择上证000001号,中国平安股票(编号SZ_000001)数据集采用2016.01.01-2019.12.31股票数据,数据内容包括当天日期,开盘价,收盘价,最高价,最低价,交易量,换手率。数据集按照0.1比例分割产生测试集。训练过程以第T-99到T天数据作为训练输入,预测第T+1天该股票开盘价。(此处特别感谢Tushare提供的股票日数据集,欢迎大家多多支持)

训练模型及结果方面,我们首先采用了LSTM(长短期记忆网络),它相比传统的神经网络能够保持上下文信息,更有利于股票预测模型基于原先的行情,预测未来的行情。LSTM网络帮助我们得到了很好的拟合结果,loss很快趋于0。之后,我们又采用比LSTM模型更新提出的Transformer Encoder部分进行测试。但发现,结果并没有LSTM优越,曲线拟合的误差较大,并且loss的下降较慢。因此本项目,重点介绍LSTM模型预测股票行情的实现思路。

2 LSTM模型原理

2.1 时间序列模型

时间序列模型:时间序列预测分析就是利用过去一段时间内某事件时间的特征来预测未来一段时间内该事件的特征。这是一类相对比较复杂的预测建模问题,和回归分析模型的预测不同,时间序列模型是依赖于事件发生的先后顺序的,同样大小的值改变顺序后输入模型产生的结果是不同的。

2.1 从RNN到LSTM

RNN:递归神经网络RNN每一次隐含层的计算结果都与当前输入以及上一次的隐含层结果相关。通过这种方法,RNN的计算结果便具备了记忆之前几次结果的特点。其中,为输入层,o为输出层,s为隐含层,而t指第几次的计算,V,W,U为权重,第t次隐含层状态如下公式所示:
S t = f ( U ∗ X t + W ∗ S t − 1 ) ( 1 ) St = f(U*Xt + W*St-1) (1) St=f(UXt+WSt1) 
在这里插入图片描述

可见,通过RNN模型想要当前隐含层状态与前n次相关,需要增大计算量,复杂度呈指数级增长。然而采用LSTM网络可解决这一问题。

LSTM(长短期记忆网络):

LSTM是一种特殊的RNN,它主要是Eileen解决长序列训练过程中的梯度消失和梯度爆炸问题。相比RNN,LSTM更能够在长的序列中又更好的表现。

在这里插入图片描述

LSTM拥有两个传输状态: c t c^{t} ct在 (cell state), h t h^{t} ht(hidden state),其中 c t c^{t} ct 的改变往往很慢,而 h t h^{t} ht不同的节点下会有很大的区别。

首先,使用LSTM的当前输入 x t x^{t} xt和上一个状态传递下来的 h t − 1 h^{t-1} ht1得到四个状态: z f z^{f} zf, z i z^{i} zi, z o z^{o} zo, z z z,前三者为拼接向量乘以权重矩阵后使用sigmoid函数得到0-1之间的值作为门控状态,后者为通过tanh函数得到 -1~1 之间的值。

在这里插入图片描述

LSTM内部有三个阶段:忘记阶段、选择记忆阶段、输出阶段

  • 忘记阶段:通过计算 z f z^{f} zf来作为门控,控制上一个状态的 c t − 1 c^{t-1} ct1需要遗忘的内容。

  • 选择记忆阶段:对输入 x t x^{t} xt进行选择记忆,门控信号由 z i z^{i} zi进行控制,输入内容由 z z z进行表示。

  • 输出阶段:决定当前状态输出的内容,通过 z o z^{o} zo控制,并且还对上一阶段得到的 c t c^{t} ct进行放缩。
    在这里插入图片描述

3LSTM预测股票模型实现

1、数据集准备

  • 数据集分割:数据集按照0.1比例分割产生测试集。训练过程以第T-99到T天数据作为训练输入,预测第T+1天该股票开盘价。
  • 对数据进行标准化:训练集与测试集都需要按列除以极差。在训练完成后需要进行逆处理来获得结果。

t r a i n ( [ : , i ] ) = ( t r a i n ( [ : , i ] ) ) − m i n ( t r a i n [ : , i ] ) / ( m a x ( t r a i n [ : , i ] ) − m i n ( t r a i n [ : , i ] ) ) ( 2 ) train([:,i])=(train([:,i]))-min(train[:,i])/(max(train[:,i])-min(train[:,i])) (2) train([:,i])=(train([:,i]))min(train[:,i])/(max(train[:,i])min(train[:,i]))2

t e s t ( [ : , i ] ) = ( t e s t ( [ : , i ] ) ) − m i n ( t r a i n [ : , i ] ) / ( m a x ( t r a i n [ : , i ] ) − m i n ( t r a i n [ : , i ] ) ) ( 3 ) test([:,i])=(test([:,i]))-min(train[:,i])/(max(train[:,i])-min(train[:,i])) (3) test([:,i])=(test([:,i]))min(train[:,i])/(max(train[:,i])min(train[:,i]))3

2、模型搭建

使用pytorch框架搭建LSTM模型,torch.nn.LSTM()当中包含的参数设置

  • 输入特征的维数: input_size=dimension(dimension=8)

  • LSTM中隐层的维度: hidden_size=128

  • 循环神经网络的层数:num_layers=3

  • batch_first: TRUE

  • 偏置:bias默认使用

全连接层参数设置:

  • 第一层:in_features=128, out_featrues=16
  • 第二层:in_features=16, out_features=1 (映射到一个值)

3、模型训练

  • 经过调试,确定学习率lr=0.00001

  • 优化函数:批量梯度下降(SGD)

  • 批大小batch_size=4

  • 训练代数epoch=100

  • 损失函数:MSELoss均方损失函数,最终训练模型得到MSELoss下降为0.8左右。

在这里插入图片描述

4、模型预测

测试集使用已训练的模型进行验证,与真实数据不叫得到平均绝对百分比误差(MAPELoss)为0.04,可以得到测试集的准确率为96%。

在这里插入图片描述

5、模型成果

下图是对整体数据集最后一百天的K线展示:当日开盘价低于收盘价则为红色,当日开盘价高于收盘价为绿色。图中还现实了当日交易量以及均线等信息。

在这里插入图片描述

LSTM模型进行预测的测试集结果与真实结果对比图,可见LSTM模型预测的结果和现实股票的走势十分接近,因此具有很大的参考价值。
在这里插入图片描述

LSTM模型训练过程中MSELoss的变化,可以看到随着训练代数的增加,此模型的MSELoss逐渐趋于0。
在这里插入图片描述

4结语

本项目使用机器学习方法解决了股票市场预测的问题。项目采用开源股票数据中心的上证000001号,中国平安股票(编号SZ_000001),使用更加适合进行长时间序列预测的LSTM(长短期记忆神经网络)进行训练,通过对训练集序列的训练,在测试集上预测开盘价,最终得到准确率为96%的LSTM股票预测模型,较为精准地实现解决了股票市场预测的问题。

在项目开展过程当中,也采用过比LSTM更加新提出的Transformer模型,但对测试集的预测效果并不好,后期分析认为可能是由于在一般Transformer模型中由encoder和对应的decoder层,但在本项目的模型中使用了全连接层代替decoder,所以导致效果不佳。在后序的研究中,可以进一步改进,或许可以得到比LSTM更加优化的结果。

源代码github下载链接:https://github.com/MiaoChenglin125/stock_prediction-based-on-lstm-and-transformer

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38092.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ARIMA模型来预测股票数据

本篇博文主要介绍如何用ARIMA模型来对股票数据做时序预测的。 文章目录 获取数据数据预处理模型识别假设检验模型预测 获取数据 这里用的是tushare库,得到万科股票半年的数据。 import tushare as t1 t1.set_token(你自己的token) tst1.pro_api() df ts.get_k_d…

基于遗传算法的BP神经网络的股票预测模型_matlab实现

文章目录 摘要bp神经网络遗传算法实验结果与分析完整代码下载: 摘要 在目前的股票投资市场,不少自然人股民的投资主要方式使根据对当天或者一个较长周期对股票数据的预测,来得到下一天的股票数据,从而进行相应的投资。为了满足股…

基于LSTM的股票预测模型_python实现_超详细

文章目录 一、背景二、主要技术介绍1、RNN模型2、LSTM模型3、控制门工作原理四、代码实现五、案例分析六、参数设置七、结论运行环境完整程序下载 一、背景 近年来,股票预测还处于一个很热门的阶段,因为股票市场的波动十分巨大,随时可能因为…

这样给宝宝起小名,好听不俗气

你家宝宝的小名叫什么? 对于父母来说,他们的宝宝不仅是这个世界上独一无二的宝贝,而且还是上天送给他们最珍贵的的礼物,所以,当他们来到这个世上的时候,父母总是喜欢把世上最美好的东西上赠与他们&#xf…

怎么样给小孩取名字?准爸妈为孩子起名字的另类姿势

老一辈都说:赐子千金,不如教子一艺,教子一艺,不如赐子好名。所以说,名字对孩子的重要性简直是不言而喻。要是起的名字奇奇怪怪的或者是寓意不好的话,大家会发现,孩子可能从去上学,就…

C# 名字五格测试

先申明,看着这个罗莊罗大师罗半仙的文章 https://blog.csdn.net/luozhuang/article/details/8725396 https://blog.csdn.net/luozhuang/article/details/8729523 他这是java版本的 我看了下,把它改成了C#版本 直接上代码吧 比较乱 没有优化命名啥的…

微信小程序:宝宝起名神器微信小程序

2022年马上到了,还不知道怎么给虎宝宝取名字嚒 那么这款小程序源码就可以帮到你了 这款小程序支持输入姓氏自动起名,不满意还可以点击换一换来找到满意的 支持起两个字或者三个字的名字 另外小编也给该款小程序添加了几个流量主广告给大家 小程序源码下载地址: 微…

根据谐音自动转换英文名的网站~如何起一个流行、有意义的英文名?你的英文名有什么内在意义吗?

今天发现自己的英文名有点low,想重新起一个。百度一搜,发现起名的网站真不少,定睛一看,起个名字要几十块?爱了爱了。 于是我花了半天时间研究,综合了网上的资源,写出这篇攻略。 ps&#xff1a…

目标检测算法——YOLOv5/YOLOv7改进之结合Swin Transformer V2(涨点神器)

&#x1f496;&#x1f496;>>>加勒比海带&#xff0c;QQ2479200884<<<&#x1f496;&#x1f496; &#x1f340;&#x1f340;>>>【YOLO魔法搭配&论文投稿咨询】<<<&#x1f340;&#x1f340; ✨✨>>>学习交流 | 温澜潮…

Pr——2020版本对导入视频如何编辑的操作

首先打开软件选择新建项目 填写好项目名称并选择该项目的位置&#xff0c;点击确定 在项目栏中右键&#xff0c;并选择导入&#xff0c;并选择想导入的视频 将视频拖动到时间轴栏&#xff0c;即可对视频进行你想要的操作。

Pr 入门系列之十:基本图形

在 Pr 中&#xff0c;文字&#xff08;包括字幕&#xff09;以及形状等被归类为图形 Graphics。 一个图形剪辑里可包含多个文本图层、形状图层以及其它媒体文件等图形元素。 提示&#xff1a; 1、图形剪辑不会出现在项目面板中&#xff0c;除非升级为源图。 2、与 Ps 一样&…

Pr 从入门到精通(合集)

PHOTOSHOPTEA 致力于打造随时可查、反复可用的工具手册&#xff0c;多数文章里少实例、无噱头。这样的文章在闲暇时读起来确实让人“头疼”。 但&#xff0c;当你遇到技术问题真正“头疼”的时候&#xff0c;其中一篇可能就是对症的“良药”&#xff1b;当你有所生疏或者有些遗…

开发中时常提到的提交pr是什么意思?

在编程开发领域&#xff0c;PR是Pull Request的缩写&#xff0c;一般用于Git/SVN等版本管理软件中。 它的过程是这样的&#xff1a;比如你在GitHub上看到一个很牛X的项目&#xff0c;你fork到自己仓库后&#xff0c;再改动一些代码&#xff0c;然后可以向提交一个pull request…

视频剪辑软件:Premiere Pro 2023 中文直装版(带语音转字幕)

Premiere Pro它是一款功能强大、灵活易用的视频编辑工具。该软件可以用于剪辑、调色、特效制作、音频处理等多种视频制作任务。Premiere Pro还支持多种视频格式&#xff0c;包括高清和超高清视频。 ​具有以下特点&#xff1a; 多格式支持&#xff1a;Premiere Pro支持多种视频…

Pr初识01

Pr初识 1.关于Pr&#xff1a;2.项目序列3.PR工作界面4.导入素材5.制式与素材管理6.剪辑与工具7.剪辑与工具&#xff08;下&#xff09;8.工具面板与时间轴面板进阶9.关键帧动画10.视频特效11.视频特效&#xff08;下&#xff09;12.音频及结合AU去除噪音13.字幕运用 1.关于Pr&a…

Premiere基础操作

一&#xff1a;设置缓存 二&#xff1a;ctrI导入素材 三&#xff1a;导入图像序列 四&#xff1a;打开吸附。 打开吸附后素材会对齐。 五&#xff1a;按~键可以全屏窗口。 六&#xff1a;向前选择轨道工具。 在时间线上点击&#xff0c;向前选中时间线上素材。向后选择轨道工具…

PR基础知识

什么是帧&#xff0c;什么叫帧速率&#xff0c;什么叫方形像素&#xff0c;什么叫场序…… 1、时长 时长为视频时间的长度&#xff0c;基本单位为秒。但是在PR软件中&#xff0c;有更为精准的时间单位计算为帧&#xff0c;也就是把1秒分为若干份&#xff0c;一份就是一帧&…

添加视频字幕后期制作Premiere Pro 2022中文

Premiere Pro 2022是一款PR视频剪辑软件&#xff0c;同时支持M1/M2芯片和Intel芯片安装&#xff0c;可以帮助用户提升自己的创作能力和创作自由度&#xff0c;具有易学、高效、精确的优点&#xff0c;可为用户提供采集、剪辑、调色、美化音频、字幕添加、输出、DVD刻录一整套的…

premiere(Pr)为视频配字幕 开放式字幕使用详解

1、前期工作&#xff1a;新建项目、新建序列、将素材导入序列&#xff0c;这里不再贴图详解 2、依次点击 – 文件 – 新建 – 字幕 3、找到开放式字幕并选择 – 确定 4、将字幕拖放到序列视频轨道&#xff0c;可以根据实际情况将字幕轨道适当拉长。 5、双击视频轨道的字幕 进行…

adobe PR2022 没有开放式字幕怎么办?

PR2022 将开放式字幕删除了 怎么用其他方法替代呢&#xff1f; 看下图&#xff0c;直接选中工作区下面的 字幕和图形 或者点击窗口后&#xff0c;勾选 文本 这里就可以看到新版的字幕 添加窗口了 直接创建新字幕轨 添加 新字幕轨道 添加 字幕分段 添加字幕 后面的操作就跟…