解读:通过挖掘股票内在特征预测股票趋势

写在前面

下面这篇文章的内容主要是来自发表于KDD2019的一篇文章《Investment Behaviors Can Tell What Inside: Exploring Stock Intrinsic Properties for Stock Trend Prediction》。这篇文章发现,职业基金经理们对于股票的共同投资行为可以反应股票的内在属性,从而基于此来提取股票属性的潜在特征,并进一步利用股票潜在特征对动态市场状态和趋势进行建模,从而生成股票与市场的动态相关性,然后将这种相关性与动态股票指标进行聚合,从而实现更准确的股票预测。原论文在文末进行获取。

1

摘要

股票趋势预测是预测股票未来价格走势的一种方法,在寻求股票投资利润最大化的过程中起着关键作用。近年来,越来越多的人在应用机器学习技术,特别是深度学习,来追求更有前途的股票预测。虽然深度学习已经有了很大的进步,但由于人类投资者对股票内在属性的理解仍然保持着领先地位。这篇论文提出通过提取和挖掘股票的内在属性以提高股票的趋势预测能力。具体来说,作者发现共同基金投资组合数据中的投资行为反映了专业基金经理对股票内在属性的共同信念,可用来提取股票属性的潜在表现以用于进一步的预测。因此,在提取股票属性的基础上,作者进一步提出利用股票表征对动态市场状态和趋势进行建模,从而生成股票与市场的动态相关性,然后将这种相关性与动态股票指标进行聚合,从而实现更准确的股票预测。最后,作者在真实股市数据上的大量实验证明了所提取的股票属性的有效性。

总而言之,这篇论文的主要贡献在于:

  • 基于同一基金经理持有的股票可能具有共同属性的原则,从共同基金组合数据中挖掘股票内在属性的表征。

  • 开发了一种新的深度学习框架,通过建模动态市场状态/趋势,将静态股票内在属性集成到动态股票预测任务中。

  • 通过实证证明了提取股票内在属性和相应的动态市场状态对真实数据的股票趋势预测的有效性。

2

模型介绍

提出的模型的整体框架如下图所示:

从投资行为中发掘股票内在特征

受观察到基金经理对不同股票内在属性的不同偏好的启发,作者提出通过挖掘基金经理集体在共同基金组合数据中的投资行为,学习股票内在特性的潜在表示。特别是,根据上述观察,同一基金管理公司的投资组合中所包含的股票更有可能具有共同的内在属性。据此,我们可以将共同基金投资组合数据转化为基金经理和股票的矩阵,并利用矩阵分解(Matrix Factorization)的方法提取每只股票的潜在向量,将其视为股票内在属性的表示。具体方式如下图所示,其中第   个基金经理的整体偏好特征向量为   ,第   个股票的内在特征向量为   ,第   基金经理对第   个股票的投资行为体现在   ,表示对该股票的投资份额。

矩阵分解被广泛应用于推荐系统、文本挖掘、计算机视觉等多种场景。因为它可以用来学习两种实体之间相互作用的潜在表示向量。在我们的任务中,给定一组已知的投资行为   ,通过求解下面的优化问题拟合训练数据,可以估计出参数   和   ,即股票和基金经理的潜在表示。

另外,在现实当中,也会有一些基金经理对某些股票的偏向作为先验知识,所以一些偏执项也被引入,因此,基金经理   对股票   的投资行为可以估计为:

这样,最后的优化目标定义为:

其中下面的正则项被引入来防止模型过拟合。

值得一提的是,基金经理的投资行为不仅取决于股票的固有属性,还取决于对股票动态走势的关注。换句话说,没有一个基金经理愿意投资一个下跌趋势明显的股票,即使它具有某些吸引他的属性。此外,在实际投资中,基金经理可能会投资其他多样化的股票,以减少有限股票的风险。因此,除了基金经理的固有偏好外,半年基金经理的投资组合还受到股票动态趋势和风险厌恶多样性的影响。对此,只要我们观察半年一次的共同基金组合数据,在足够宽广的时间段内,积累的投资行为可以放大基金经理的长期偏好,缓解短期趋势动态或多元化投资的影响,降低风险。这样,通过挖掘足够长时间范围内的共同基金投资组合数据,我们就可以安心地发掘股票的内在属性。

根据股票内在特征进行预测

在提取了股票的内在特征之后,接下来将进行通过股票内在特征来进行股票的预测。预测股票的未来价格趋势可以作为一个典型的机器学习问题,要么是一个价格趋势的分类任务,要么是一个价格收益率的回归任务。它们都是每只股票映射到某个特征空间,然后通过预测函数将其转换为其标签。这样子做每只股票都是一个独立的个体,因此,这篇文章的预测标签不是上涨或者下跌,而是将收益率作为目标分数,用于评判一只股票的收益能力。其目标函数是:

另外,考虑到股票市场具有强烈的时间动态特性,所以将股票的历史状态因素作为预测其未来趋势的因素是直观的。因此,大多数传统方法将动态输入,如每日价格和各种指标,输入到时间序列分析模型,如自回归模型,卡尔曼滤波器,技术分析等。近年来,随着深度学习技术的快速发展,深度神经网络,特别是循环神经网络已经在股票预测任务中得到了应用并产生了最先进的性能。因此,我们可以抽象出DNN方法在不失一般性的情况下,本质上是先将t时刻每个股票的动态输入,投影到一个动态的股票表示法   中,然后根据这个更高层次的表示法进行预测。虽然深度学习已经有了很大的进步,但人类投资者由于对股票内在属性的理解,仍然保持着领先地位。因此,将股票属性纳入当前的股票预测框架,以追求更准确的股票预测是十分有价值的。一种简单的方法是将股票属性的表示与动态表示结合在一起,形式上可以表示为下面的公式,其中   表示股票j的动态输入特征,   表示股票j的内在特征。

直觉认为市场代表应该反映市场对各种股票属性的当前偏好,我们提出了基于一组在某一天收益率最高的股票的日市场代表模型,考虑到收益率最高的股票可以反映最新的市场偏好。特别地,考虑到收益率最高的股票能够反映最新的市场偏好,市场代表性是通过对排名靠前的股票的代表性进行平均计算的。更正式地说,我们可以根据t时刻收益率在top-K内的股票表示来计算t时刻的市场状态   

这个过程如下图所示:

在有了这个市场表示之后,我们可以计算每个股票的股票属性和当前市场状态之间的相关性为:

以这样的方式实施预测会假设市场状态在连续两天保持一致,所以考虑到这一假设的局限性,根据历史市场状态建立未来市场趋势模型是非常重要的,而不是仅仅使用前一天的市场状态进行股票预测。为此,作者用到了LSTM对市场状态进行动态建模,即:

这样,将股票状态与市场的动态表示进行结合之后,就可以实现从t到t+1的预测了,整体的模型框架可以参考本章开头的模型整体框架进行梳理。

3

实验验证

在股票预测模型中,作者收集了2012 - 2016年中国股票每日价格和成交量的时间序列数据,总共有2000多只股票,覆盖了绝大多数中国股票。为了进一步生成动态指标,作者按照前面的研究计算了总共101个交易指标。为了有效提取股票内在属性,作者还收集了2012 - 2016年中国共同基金投资组合半年报告。下表是经过半年共同基金组合报告过滤后的基金和股票数量统计。在预测股票走势时,我们会过滤掉在收盘期内超过2%的交易日中处于暂停交易状态的股票。对于那些从未被任何基金投资的股票,用零向量进行表示。

用到的评估指标如下:

为了检验从共同基金组合中学习到的股票表示的效果,作者采用一些定性分析来评估学习到的股票表示是否能够捕获内在属性。具体地,基于它们各自的学习表示对所有股票进行聚类。下表显示了获得的2015年下半年股票集群的三个例子。从这个表中我们可以发现,第一个集群中所有的股票都属于基础产业,而第二个集群中所有的股票都与轻工业相关。此外,畜牧业和农业工业的大部分存货都聚集在第三个集群中。这样的聚类结果可以清楚地表明,从共同基金组合中提取的股票表示具有一定的内在属性。

下图是分别是提出的模型通过筛选Top50、Top100以及Top200后的每半年一次计算的MAP结果。

为了探究模型的盈利能力,文章选取了预测收益率最高的前50只股票组成投资组合,与对比方法得到的累计收益率图像如下图所示。从中可以看出,相比于其他的LSTM等对比方法,提出的方法具有明显更强的收益能力。

4

总结

这篇文章提出在股票预测任务中需要考虑股票的内在特性,以改进现有的基于动态输入的股票预测模型。本文有三个贡献:一是首次利用股票内在属性帮助投资者进行股票选择;其次,我们提出从共同基金组合中提取股票的内在属性;第三,我们建立了一个新的模型,以动态的方式使用静态的股票属性,通过衡量市场和股票之间的相关性来进行预测。未来,我们计划从其他有价值的数据中寻找股票的内在属性,并对市场状态模型进行专门的扩展。此外,我们将探讨更多有用的基金经理投资行为,以改进股票预测模型。另外,感兴趣的读者也可以参考该课题组之前发过的一篇paper,与该研究主题类似,那篇paper也有在本公众号进行过推送,解读:通过Stock Embedding的个股技术指标优化。

参考文献:

[1] Chen, C. ,  Zhao, L. ,  J  Bian,  Xing, C. , &  Liu, T. Y. . (2019). Investment Behaviors Can Tell What Inside: Exploring Stock Intrinsic Properties for Stock Trend Prediction. the 25th ACM SIGKDD International Conference. ACM.

关注《人工智能量化实验室》公众号,后台发送082可获取原论文。

了解更多人工智能与
量化金融知识

<-请扫码关注

让我知道你在看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/16717.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用DeepAR实现股价预测

使用DeepAR实现股价预测 文章目录 使用DeepAR实现股价预测获取股票列表从众多股票中采样100支日期处理函数拉取等长度的股票&#xff0c;并保存 各指标解释预测区间长度及上下文选取给这78支股票所在行业进行归类 目标变量处理协变量处理协变量归一化操作 训练、测试数据划分训…

基于tushare的股票评级与预测

本文内容 股票评级思路&#xff08;一&#xff09; 用百度得到的股票评级六大要素进行股票评分&#xff0c;并用后面的数据对其进行正确性检测。股票评级思路&#xff08;二&#xff09; 在思路一的基础上加入大盘历史的涨跌数据&#xff0c;对评分进行了优化&#xff0c;也进…

python采集往期股票数据进行分析预测

前言 嗨喽~大家好呀&#xff0c;这里是魔王呐 ❤ ~! 准备工作 既然要去赚马内&#xff0c;咱们首先要获取往期的数据来进行分析&#xff0c; 通过往期的规律来对当前进行预测&#xff0c;准不准我不知道&#xff0c;反正比人预测的准&#xff0c; 不准也不要喷我&#xff0…

[ChatGPT最强竞品]爆火,不限量不要钱不用魔法免费注册!

1免责声明 本公众号所发布的文章及工具只限交流学习&#xff0c;本公众号不承担任何责任&#xff01;如有侵权&#xff0c;请告知我们立即删除。 原文地址&#xff1a;[ChatGPT最强竞品]爆火&#xff0c;不限量不要钱不用魔法免费注册&#xff01; 2Claude 介绍 Claude 是下一代…

免费可用!ChatGPT最强竞品来了

&#xff08;永久免费&#xff0c;扫码加入&#xff09; 来源&#xff1a;机器之心 此次&#xff0c;Claude 2 除了一大波能力上的升级&#xff0c;更重要的是大家都可以用了。 今日&#xff0c;那个被很多网友称为「ChatGPT 最强竞品」的人工智能系统 Claude 迎来了版本大更新…

chatgpt-AIGC-从数学开始

向量 向量是由n个实数组成的一个n行1列&#xff08;n*1&#xff09;或一个1行n列&#xff08;1*n&#xff09;的有序数组&#xff1b; 点积 - 向量的点乘,也叫向量的内积、数量积&#xff0c;对两个向量执行点乘运算&#xff0c;就是对这两个向量对应位一一相乘之后求和的操作…

ChatGPT不仅能写代码还能改bug,这届AI全能

工欲善其事必先利其器&#xff0c;我们先来看一下什么是ChatGPT。小试牛刀&#xff0c;让ChatGPT自己来回答一下&#xff1a; 从介绍中可以看出来ChatGPT很擅长处理自然语言&#xff0c;那我们来看看AI处理编程语言的效果如何呢&#xff1f; 第一个挑战&#xff0c;让ChatGP…

如何搭建与使用FTP服务器

文档资料&#xff1a;https://download.csdn.net/download/wangshuxuncom/87845843https://download.csdn.net/download/wangshuxuncom/87845843 视频教程&#xff1a;如何搭建与使用FTP服务器_哔哩哔哩_bilibili如何搭建与使用FTP服务器共计5条视频&#xff0c;包括&#xff…

如何使用Harbor私有镜像仓库

文档资料&#xff1a;https://download.csdn.net/download/wangshuxuncom/87835045https://download.csdn.net/download/wangshuxuncom/87835045 视频教程&#xff1a;服务端_哔哩哔哩_bilibili服务端是如何使用Harbor私有镜像仓库的第1集视频&#xff0c;该合集共计5集&#…

Docker插件一键部署SpringBoot项目

视频&#xff1a; Docker插件一键部署SpringBoot项目_哔哩哔哩_bilibiliDocker插件一键部署SpringBoot项目共计4条视频&#xff0c;包括&#xff1a;环境搭建、集成Docker、创建项目等&#xff0c;UP主更多精彩视频&#xff0c;请关注UP账号。https://www.bilibili.com/video/…

如何在Linux中安装GitLab

文档资料&#xff1a;https://download.csdn.net/download/wangshuxuncom/87840407https://download.csdn.net/download/wangshuxuncom/87840407 视频教程&#xff1a;如何在Linux中安装GitLab_哔哩哔哩_bilibili如何在Linux中安装GitLab共计5条视频&#xff0c;包括&#xff…

老高的 IT 漫谈 - 20200501

新形式 作为一个从上个世纪到现在的 IT 行业老年人&#xff0c;这个公众号开通的初衷其实是想写 IT 圈的事情&#xff0c;甚至是吐槽。但是随着那时候开始折腾海外数据的原因&#xff0c;工作越来越忙&#xff0c;微博都没时间上了&#xff0c;哪有时间写不正经的内容&#xff…

老高的 IT 漫谈 - 20200512

前言&#xff1a; 月初写了第一篇漫谈&#xff0c;反馈还好&#xff0c;所以继续努力写吧&#xff0c;也许以后不做 IP 库了&#xff0c;可以转型做 IT 评论养家糊口了。。。 闲言碎语不再讲&#xff0c;下面开始正题。 腾讯视频超前点播案 内容链接&#xff1a;腾讯“超前点播…

当杠精型AI丈夫遇上阴阳怪气AI老婆,你的代码玩得转吗?

玩趣味活动 赢千元奖金 DataFountain社区首个趣味活动来啦&#xff01;&#xff01;&#xff01; 活动已发车&#xff0c;来不及解释了&#xff0c;先上车&#xff1a;https://www.datafountain.cn/information/activity/3 人工智能问答爆火&#xff0c;你的算法技能储备跟上…

AI在网上给自己建了一座“鬼城”

新一轮 AI 革命的浪潮正在席卷全球&#xff0c;人们看到了 AGI 的曙光和智能的涌现。 你可以在 Glow 或者 Character.AI 上与虚拟人对话&#xff0c;或者让 ChatGPT 像模像样地扮演各种人格。 但你是否想过&#xff0c;成千上万的拥有「智能」的 AI 聚集在同一个平台&#xff0…

互联网惊现 AI 鬼城,上万 AI 发帖聊天,人类禁止入内,这一天终于来了

新一轮 AI 革命的浪潮正在席卷全球&#xff0c;人们看到了 AGI 的曙光和智能的涌现。 你可以在 Glow 或者 Character.AI 上与虚拟人对话&#xff0c;或者让 ChatGPT 像模像样地扮演各种人格。 但你是否想过&#xff0c;成千上万的拥有「智能」的 AI 聚集在同一个平台&#xf…

人类被禁言!上万不同人格AI在互联网“鬼城”中尽情聊天互动

导语 近期&#xff0c;名为“Chirper”的网络社区突然爆火&#xff0c;而这个AI社区的规则也非常简单&#xff0c;只允许AI聊天、互动&#xff0c;人类被禁止参与聊天&#xff0c;只能旁观。 早在2017年时&#xff0c;科幻小说作家大卫布林就曾做出过一次预测&#xff1a;在三到…

周鸿祎,用AI再造一个新360

文&#xff5c;光锥智能&#xff0c;作者&#xff5c;刘雨琦、郝鑫&#xff0c;编辑&#xff5c;王一粟 ChatGPT的出现&#xff0c;让一直“沉寂”的科技大佬们再次热血沸腾起来。 比尔盖茨笃定地认为&#xff0c;“GPT是40年内最具革命性的机会”&#xff1b;黄仁勋一路高歌“…

Python 初版发布 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」&#xff0c;从过去看未来&#xff0c;从现在亦可以改变未来。 今天是 2023 年 2 月 20 日&#xff0c;在历史上的今天&#xff0c;吉多范罗苏姆正式对外公布 Python 代码&#xff0c;版本为 0.9.0。当前&#xff0c;Python 稳定版为 3.10.2…

实测阿里“通义千问”!一花独放不是春,百花齐放春满园

阿里的大模型“通义千问”今天开启内测&#xff0c;距百度“文心一言”发布差不多20天。今天看到消息后厚着脸皮找达摩院的朋友要邀请码&#xff0c;下午拿到后&#xff0c;赶紧测了一下。 官方网址&#xff1a;https://tongyi.aliyun.com/chat 刚好上次文心一言出来的时候测试…