Twitter 能否预测股市?

http://www.guokr.com/article/62535/


Lithium锂  2011-09-06 20:30

今年5月,世界首家基于社交媒体的对冲基金 Derwent Capital Markets 在屡次跳票后终于上线。它会即时关注 Twitter 中的公众情绪指导投资。正如基金创始人保罗•郝汀(Paul Hawtin)表示:“长期以来,投资者已经广泛地认可金融市场由恐惧和贪婪驱使,但我们从未拥有一种技术或数据来量化人们的情感。”一直为金融市场非理性举动所困惑的投资者,终于有了一扇可以了解心灵世界的窗户——那便是 Twitter 每天浩如烟海的推文[1]。

小试牛刀,成果斐然

尽管针对公众情绪的调查耗时耗力,仍有一些研究另辟蹊径,揭示出情绪与股市关联中的冰山一角。对39个国家的调查表明,当在如世界杯、欧洲杯的国际球赛中输球时,当地的股价指数会受到显著的负面影响[2]。天气变化也会波及股市。给一点阳光,股票收益率便会和人们的心情一样灿烂[3]。

美国印第安纳大学的约翰•博伦(Johan Bollen)等人[4],则将目光投向了新兴的社交网络 Twitter。这个反映公众情绪的绝佳晴雨表,在预测电影票房、选举结果等方面,都有不俗的表现。研究者采用了两种情绪追踪工具。一种是开源工具OpinionFinder,能将推文二分为正面和负面情绪;另一种则是研究者在临床上使用的情绪状态量表(POMS)基础上,新开发出的情绪测试工具GPOMS。它能将公众的情绪分为冷静、警惕、确信、活力、友善和幸福这六个类别。

为了验证两个工具的准确性,研究者将公众情绪和社会事件对比,结果十分吻合。例如,在总统大选日(2008年11月4日)期间,Twitter 在大选日前一天开始紧张,在大选日当天变得冷静、活力、友善、幸福,总体情绪在大选日后又回归平常。在感恩节(11月28日)当天,整个 Twitter 洋溢着浓浓的幸福味道,过后又恢复正常。

而最令人激动的是,将“冷静”情绪指数后移3天,竟然和道琼斯工业平均指数惊人一致。其他情绪则没有这样的效果。另外,研究者还测试了一个称为SOFNN的股市预测模型。当仅输入股市数据时,模型已经有73.3%的准确率;加入“冷静”的情感信息后,准确率更升至86.7%。

但是,Twitter 情绪指标,仍然不可能预测出会冲击金融市场的突发事件。例如,在2008年10月13号,美国联邦储备委员会突然启动一项银行纾困计划,令道琼斯指数反弹,而3天前的Twitter冷静指数自然毫无征兆。而且,研究者自己也意识到,Twitter 用户与股市投资者并不完全重合,这样的样本代表性有待商榷。

/gkimage/g2/ip/6n/g2ip6n.png

公众情绪中的冷静指数(红线)后移3天和道琼斯工业指数(蓝线)能够很好的匹配。这种一致性在灰色区域尤其显著,而在白色区域不尽如人意。

深入挖掘,仍有收获

博伦的研究,也启发着更多研究者对于社交网络进一步地探讨。麻省理工学院的张雪(音译)等人[6],根据情绪词将推文标定为正面或负面情绪。结果发现,无论是如“希望”的正面情绪,或是“害怕”、“担心”的负面情绪,其占总推文数的比例,都预示着道琼斯指数、标准普尔500指数、纳斯达克指数的下跌。研究者据此认为,只要是情绪的突然爆发,无论希望或担忧,都反映出人们对于市场的不确定性,因此能预测股市之后的走向。

慕尼黑工业大学的两位学者对 Twitter 进行了更为细致的分析[5]。他们筛选出提到标准普尔100指数中的公司的推文(比如 $AAPL 代表苹果公司),分为 “买入”、“持有”或“卖出”三类,并算出每支股票的看涨程度。结果同样鼓舞人心。例如,推文的总数和交易量,看涨程度和标准普尔100指数之间,都有密切相关。更具操作意义的是,如果投资者采取“买入”看涨程度最高的3支股票,“卖出”最低3支的策略,半年便有高达15%的收益。

美国佩斯大学的博士生亚瑟•奥康纳(Arthur O’Connor)[7],则采用了另外一种思路。他追踪了星巴克、可口可乐和耐克三家公司在社交媒体上的受欢迎程度,同时比较它们的股价。他发现,Facebook上的粉丝数、Twitter 上的听众数和 Youtude 上的观看人数,都和股价密切相关。品牌的受欢迎程度,还能预测股价在10天、30天之后的上涨情况。

/gkimage/wb/2i/b3/wb2ib3.png

品牌在社交媒体上的受欢迎程度,能够预测它们在股市中的表现。图片来自 famecount.com

争议颇多

这样前瞻性的尝试,自然会招来反对的声音。特许财务分析师(CFA)协会创新与新兴媒体主管莱恩•科斯塔(Len Costa)虽然态度温和,但仍不赞成 Twitter 情绪指数的滥用:“对于严肃的专业投资者来说,在作出投资决定时,没有什么可以替代合理的审慎、独立的专业判断和由适当的研究与调查支持的基础。”[8]

美国圣母大学的研究者则对情绪分析的基础提出质疑。他们发现在语义分析中广泛使用的哈佛心理社会学词典中,近3/4被归为“负面”的词汇,在金融领域中并无情感判断[9]。例如vice(邪恶)、tire(疲劳)、crude(粗鲁的),可能仅仅是vice-president(副总裁)、tire(轮胎)和crude oil(原油)。

然而,这一切反对声音,似乎都无法阻止投资者对于新兴的社交网络倾注更多的热情(希望他们对果壳网也如此)。一份八月份的报道显示,利用 Twitter 的对冲基金 Derwent Capital Markets 在首月的交易中确实盈利了。它以1.85%的收益率,让平均数只有0.76%的其他对冲基金相形见绌[10]。

这是最好的时代。在5亿用户的 Facebook,2亿用户的 Twitter 构筑的社交网络帝国中,似乎一切皆有可能,每天都让人期待。这是最坏的时代。谣言共真相一色,吹捧与贬低齐飞。我们每一个人都身处于社交网络之中,当你正在阅读果壳网这篇文章时尤其如此,而我们却不知道它最终会将我们引向何方。


名词解释

【 对冲基金 (hedge fund)】是指由金融期货(financial futures)和金融期权(financial option)等金融衍生工具(financial derivatives)与金融组织结合后,高风险投机为手段而以盈利为目的的金融基金

【 跳票 】原本为金融用语,指因为支票帐户内没有钱,银行无法兑现支票,遂把此空头支票寄还给支票持有人的行为。“跳票”之后,开此空头支票的人只会受到罚款。现在也指无法在原定发售日推出的产品都可说是跳了票,有“延期发行”的意思。现在跳票通俗说就是本来公布了某天要做什么,但是一直没有做。

【 标准普尔100指数 】标准普尔指数是美国最大的证券研究机构即标准•普尔公司编制的股票价格指数。是继道•琼斯之后美国第二大股票价格指数。标普100指数是由标准普尔公司在标普500当中最强的100只成份股编写而成。

参考文献

[1] The World's First Twitter-Based Hedge Fund Is Finally Open for Business

[2] Edmans A, Garca D, Norli Ø. (2007). Sports Sentiment and Stock Returns. Journal of Finance 62, 1967–1998.

[3] Hirshleifer D, Shumway T. (2003). Good Day Sunshine: Stock Returns and the Weather. Journal of Finance 58, 1009–1032.[4]Bollen J, Mao HN, Zeng XJ. (2010). Journal of Computational Science. 2(1), 1-8.

[4] Bollen J, Mao HN, and Zeng XJ. (2010). Twitter mood predicts the stock market, Arxiv working paper, Indiana University.

[5] Sprenger, Timm O. and Welpe, Isabell M. (2010). Tweets and Trades: The Information Content of Stock Microblogs. http://ssrn.com/abstract=1702854

[6] Zhang X, Fuehres H, and Gloor P. (2010). Predicting stock market indicators through Twitter – “I hope it is not as bad as I fear”. In COIN Collaborative Innovations Networks Conference, 1-8.

[7] New study finds link between social media popularity and stock prices

[8] Can Twitter Predict Stock Market Moves?

[9] Tim Loughran, Bill Mcdonald. (2011). When is a Liability not a Liability Textual Analysis, Dictionaries, and 10-Ks. The Journal of Finance. 66(1), 35–65.

[10] Twitter Hedge Fund Beat Market In Its First Month


Lithium锂  2011-09-06 20:30

今年5月,世界首家基于社交媒体的对冲基金 Derwent Capital Markets 在屡次跳票后终于上线。它会即时关注 Twitter 中的公众情绪指导投资。正如基金创始人保罗•郝汀(Paul Hawtin)表示:“长期以来,投资者已经广泛地认可金融市场由恐惧和贪婪驱使,但我们从未拥有一种技术或数据来量化人们的情感。”一直为金融市场非理性举动所困惑的投资者,终于有了一扇可以了解心灵世界的窗户——那便是 Twitter 每天浩如烟海的推文[1]。

小试牛刀,成果斐然

尽管针对公众情绪的调查耗时耗力,仍有一些研究另辟蹊径,揭示出情绪与股市关联中的冰山一角。对39个国家的调查表明,当在如世界杯、欧洲杯的国际球赛中输球时,当地的股价指数会受到显著的负面影响[2]。天气变化也会波及股市。给一点阳光,股票收益率便会和人们的心情一样灿烂[3]。

美国印第安纳大学的约翰•博伦(Johan Bollen)等人[4],则将目光投向了新兴的社交网络 Twitter。这个反映公众情绪的绝佳晴雨表,在预测电影票房、选举结果等方面,都有不俗的表现。研究者采用了两种情绪追踪工具。一种是开源工具OpinionFinder,能将推文二分为正面和负面情绪;另一种则是研究者在临床上使用的情绪状态量表(POMS)基础上,新开发出的情绪测试工具GPOMS。它能将公众的情绪分为冷静、警惕、确信、活力、友善和幸福这六个类别。

为了验证两个工具的准确性,研究者将公众情绪和社会事件对比,结果十分吻合。例如,在总统大选日(2008年11月4日)期间,Twitter 在大选日前一天开始紧张,在大选日当天变得冷静、活力、友善、幸福,总体情绪在大选日后又回归平常。在感恩节(11月28日)当天,整个 Twitter 洋溢着浓浓的幸福味道,过后又恢复正常。

而最令人激动的是,将“冷静”情绪指数后移3天,竟然和道琼斯工业平均指数惊人一致。其他情绪则没有这样的效果。另外,研究者还测试了一个称为SOFNN的股市预测模型。当仅输入股市数据时,模型已经有73.3%的准确率;加入“冷静”的情感信息后,准确率更升至86.7%。

但是,Twitter 情绪指标,仍然不可能预测出会冲击金融市场的突发事件。例如,在2008年10月13号,美国联邦储备委员会突然启动一项银行纾困计划,令道琼斯指数反弹,而3天前的Twitter冷静指数自然毫无征兆。而且,研究者自己也意识到,Twitter 用户与股市投资者并不完全重合,这样的样本代表性有待商榷。

/gkimage/g2/ip/6n/g2ip6n.png

公众情绪中的冷静指数(红线)后移3天和道琼斯工业指数(蓝线)能够很好的匹配。这种一致性在灰色区域尤其显著,而在白色区域不尽如人意。

深入挖掘,仍有收获

博伦的研究,也启发着更多研究者对于社交网络进一步地探讨。麻省理工学院的张雪(音译)等人[6],根据情绪词将推文标定为正面或负面情绪。结果发现,无论是如“希望”的正面情绪,或是“害怕”、“担心”的负面情绪,其占总推文数的比例,都预示着道琼斯指数、标准普尔500指数、纳斯达克指数的下跌。研究者据此认为,只要是情绪的突然爆发,无论希望或担忧,都反映出人们对于市场的不确定性,因此能预测股市之后的走向。

慕尼黑工业大学的两位学者对 Twitter 进行了更为细致的分析[5]。他们筛选出提到标准普尔100指数中的公司的推文(比如 $AAPL 代表苹果公司),分为 “买入”、“持有”或“卖出”三类,并算出每支股票的看涨程度。结果同样鼓舞人心。例如,推文的总数和交易量,看涨程度和标准普尔100指数之间,都有密切相关。更具操作意义的是,如果投资者采取“买入”看涨程度最高的3支股票,“卖出”最低3支的策略,半年便有高达15%的收益。

美国佩斯大学的博士生亚瑟•奥康纳(Arthur O’Connor)[7],则采用了另外一种思路。他追踪了星巴克、可口可乐和耐克三家公司在社交媒体上的受欢迎程度,同时比较它们的股价。他发现,Facebook上的粉丝数、Twitter 上的听众数和 Youtude 上的观看人数,都和股价密切相关。品牌的受欢迎程度,还能预测股价在10天、30天之后的上涨情况。

/gkimage/wb/2i/b3/wb2ib3.png

品牌在社交媒体上的受欢迎程度,能够预测它们在股市中的表现。图片来自 famecount.com

争议颇多

这样前瞻性的尝试,自然会招来反对的声音。特许财务分析师(CFA)协会创新与新兴媒体主管莱恩•科斯塔(Len Costa)虽然态度温和,但仍不赞成 Twitter 情绪指数的滥用:“对于严肃的专业投资者来说,在作出投资决定时,没有什么可以替代合理的审慎、独立的专业判断和由适当的研究与调查支持的基础。”[8]

美国圣母大学的研究者则对情绪分析的基础提出质疑。他们发现在语义分析中广泛使用的哈佛心理社会学词典中,近3/4被归为“负面”的词汇,在金融领域中并无情感判断[9]。例如vice(邪恶)、tire(疲劳)、crude(粗鲁的),可能仅仅是vice-president(副总裁)、tire(轮胎)和crude oil(原油)。

然而,这一切反对声音,似乎都无法阻止投资者对于新兴的社交网络倾注更多的热情(希望他们对果壳网也如此)。一份八月份的报道显示,利用 Twitter 的对冲基金 Derwent Capital Markets 在首月的交易中确实盈利了。它以1.85%的收益率,让平均数只有0.76%的其他对冲基金相形见绌[10]。

这是最好的时代。在5亿用户的 Facebook,2亿用户的 Twitter 构筑的社交网络帝国中,似乎一切皆有可能,每天都让人期待。这是最坏的时代。谣言共真相一色,吹捧与贬低齐飞。我们每一个人都身处于社交网络之中,当你正在阅读果壳网这篇文章时尤其如此,而我们却不知道它最终会将我们引向何方。


名词解释

【 对冲基金 (hedge fund)】是指由金融期货(financial futures)和金融期权(financial option)等金融衍生工具(financial derivatives)与金融组织结合后,高风险投机为手段而以盈利为目的的金融基金

【 跳票 】原本为金融用语,指因为支票帐户内没有钱,银行无法兑现支票,遂把此空头支票寄还给支票持有人的行为。“跳票”之后,开此空头支票的人只会受到罚款。现在也指无法在原定发售日推出的产品都可说是跳了票,有“延期发行”的意思。现在跳票通俗说就是本来公布了某天要做什么,但是一直没有做。

【 标准普尔100指数 】标准普尔指数是美国最大的证券研究机构即标准•普尔公司编制的股票价格指数。是继道•琼斯之后美国第二大股票价格指数。标普100指数是由标准普尔公司在标普500当中最强的100只成份股编写而成。

参考文献

[1] The World's First Twitter-Based Hedge Fund Is Finally Open for Business

[2] Edmans A, Garca D, Norli Ø. (2007). Sports Sentiment and Stock Returns. Journal of Finance 62, 1967–1998.

[3] Hirshleifer D, Shumway T. (2003). Good Day Sunshine: Stock Returns and the Weather. Journal of Finance 58, 1009–1032.[4]Bollen J, Mao HN, Zeng XJ. (2010). Journal of Computational Science. 2(1), 1-8.

[4] Bollen J, Mao HN, and Zeng XJ. (2010). Twitter mood predicts the stock market, Arxiv working paper, Indiana University.

[5] Sprenger, Timm O. and Welpe, Isabell M. (2010). Tweets and Trades: The Information Content of Stock Microblogs. http://ssrn.com/abstract=1702854

[6] Zhang X, Fuehres H, and Gloor P. (2010). Predicting stock market indicators through Twitter – “I hope it is not as bad as I fear”. In COIN Collaborative Innovations Networks Conference, 1-8.

[7] New study finds link between social media popularity and stock prices

[8] Can Twitter Predict Stock Market Moves?

[9] Tim Loughran, Bill Mcdonald. (2011). When is a Liability not a Liability Textual Analysis, Dictionaries, and 10-Ks. The Journal of Finance. 66(1), 35–65.

[10] Twitter Hedge Fund Beat Market In Its First Month

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/30116.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt给的代码时有bug的

今天时2023-4-19,我想获取上个季度的起始日期,就再chatgpt上问了下 from datetime import date, timedeltadef get_last_quarter_dates():today date.today()month (today.month - 1) % 3last_quarter_end date(today.year, month 1, 1) - timedelta…

解决 error: failed to push some refs to ‘https://github.com/mxp520/test-spring-cloud-base.git‘

在使用git对源代码进行push的到github时,可能会出现错误,如下图所示 出现错误的主要原因是github中的README.md文件不在本地代码目录中 可以通过如下命令进行代码合并【注:pullfetchmerge] 执行上面代码后可以看到本地代码库中多了README.md文…

如何搭建一个自己的 cli 脚手架

搭建脚手架的目的:快速搭建项目的基本结构并提供项目规范和约定。 搭建 cli 脚手架 1.npm init -y // 快速初始化一个项目 2.新建命令行的入口文件 /bin/cli.js #! /usr/bin/env node //用于解释程序的脚本console.log(Hello World!) //为了测试是否正常3…

GPT系列:GPT1 -> 2 -> 3 -> InstructGPT ->ChatGPT

2018年6月 GPT-1:【无监督预训练有监督微调】 大量数据(约5GB文本)上无监督训练,然后针对具体任务在小的有监督数据集上做微调; 关键词:“scalable, task-agnostic system”;8个GPU上训练一个月…

【通览一百个大模型】Anthropic LLM(Anthropic)

【通览一百个大模型】Anthropic LLM(Anthropic) 作者:王嘉宁,本文章内容为原创,仓库链接:https://github.com/wjn1996/LLMs-NLP-Algo 订阅专栏【大模型&NLP&算法】可获得博主多年积累的全部NLP、大…

chatgpt写小代码的能力很可以

最近做财务报销单时遇到了一点小问题:有11项比较零散的报销单,费用分别是 180 ,160 ,235,260,320,520,375 ,155,255,1050,135元&#…

TTS算法笔记:MusicLM- Generating Music From Text(AI生成音乐)

1. 介绍 摘要: 介绍了一个以文本作为条件,生成高保真、长时间片的音乐音频。比如文本为“由扭曲的吉他重复段伴奏的平静的小提琴旋律”,MusicLM可以可以根据文本条件,生成24kHz采样率,分钟级别的连续音乐音频。 从摘…

神经网络训练中的Tricks之高效BP(反向传播算法)

神经网络训练中的Tricks之高效BP(反向传播算法) zouxy09qq.com http://blog.csdn.net/zouxy09 Tricks!这是一个让人听了充满神秘和好奇的词。对于我们这些所谓的尝试应用机器学习技术解决某些问题的人,更是如此。曾记得&#xf…

Chainlink 预言机的原理解析

本文来自于 8 月19 日 Chainlink 开发者社区中国负责人 Frank ,在 DApp Learning 分享会上对于 Chainlink 预言机的原理的讲解,以下是这节分享会的总结内容。有兴趣的小伙伴可以结合视频一起学习: 为什么区块链无法主动获取外界数据 区块链…

预言机(Oracle)

文章目录 一、概述1.1、为什么需要1.2、应用场景1.3、现有的预言机产品1.4、基本原理 二、蚂蚁区块链 BaaS 平台–外部数据源服务三、主流预言机:Oraclize3.1 使用举例3.2 数据源3.3 收费3.4 真实性:3.5 解析助手3.6 加密查询3.7 原理 四、参考 一、概述…

第147篇 笔记-预言机(Oracle)

定义:区块链预言机是将区块链连接到外部系统的实体,从而使智能合约能够基于现实世界的输入和输出执行。 预言机为分散的 Web3 生态系统提供了一种访问现有数据源、遗留系统和高级计算的方式。去中心化预言机网络(DON)支持创建混合…

语音识别-TDNN

近来在了解卷积神经网络(CNN),后来查到CNN是受语音信号处理中时延神经网络(TDNN)影响而发明的。本篇的大部分内容都来自关于TDNN原始文献【1】的理解和整理。该文写与1989年,在识别"B", "D&…

语音识别技术对比分析

文章目录 一、语音识别产品对比二、百度语音识别产品1、套餐及价格:2、官网3、调研结果 三、华为语音识别产品四、阿里云语音识别产品1、套餐及价格:2、官网地址3、调研结果 五、腾讯云语音识别产品1、套餐及价格2、官网3、调研结果 六、科大讯飞语音识别…

语音识别SpeechRecognition

语音识别 1. 声音的本质是震动,震动的本质是位移关于时间的函数 Signal: s f(t) 波形文件(.wav)中记录了不同采样时刻的位移 2. 通过傅里叶变换 可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布,建…

各种情人节,程序员教你5个表白代码,牢牢主抓她的心

刚过完年就来到了一个相当重要的节日:情人节。一个有人欢喜有人愁的节日,虽然对一些单身人士不太友好,但还有不少人都在等这个节日进行表白。毕竟这个日子的成功率会高一些。 情人节少不了送花送礼物,作为一个程序员,…

技术创业者必读:从验证想法到技术产品商业化的全方位解析

导语 | 技术创业之路往往充满着挑战和不确定性,对于初入创业领域的人来说,如何验证自己的创业想法是否有空间、如何选择靠谱的投资人、如何将技术产品商业化等问题都需要认真思考和解决。在「TVP 技术夜未眠」第六期直播中,正马软件 CTO、腾讯…

麦肯锡给CEO的元宇宙指南

ChatGPT突然大张旗鼓地登上全球新闻的头条时,元宇宙似乎如明日黄花般过气了,未来渺茫起来。而麦肯锡的4位合伙人在今年1月给全球CEO们的“元宇宙指南”中强调,“太大元宇宙 ,不容忽视”。《元宇宙日爆》编译了这份指南供企业管理者…

AI大模型只能沦为“锦上添花”吗?

出品 | 虎嗅科技组作者 | 齐健编辑 | 廖影头图 | 虎嗅 “每个人咨询的第一个问题都是:你们在大模型方面做了什么?” 7月8日,2023世界人工智能大会(下称WAIC),一位参展商告诉笔者他的感受。——“大模型”&a…

chatgpt赋能python:Python在Win7上的安装教程

Python在Win7上的安装教程 如果你是一名Win7用户,并且打算开始学习或者使用Python编程语言,那么本文将会为你提供一个简单易懂的Python安装教程。 1. 下载Python 在安装Python之前,你需要先去Python的官方网站(https://www.pyt…

chatgpt赋能python:Python安装两个版本详细教程

Python安装两个版本详细教程 Python是一种广泛使用的编程语言,由于不同版本之间的差异,部分开发者需要同时安装两个不同版本的Python。本篇文章将为大家详细介绍Python安装两个版本的方法。 为何需要安装两个不同版本的Python Python的发行版&#xf…