一篇来自佛罗里达大学的研究报告震惊了金融圈:用ChatGPT对公司新闻进行情绪分析,并按此在股市做多、卖空,最高可获得超过500%的投资回报率。虽然坊间对这份报告中惊人的回报率数据有所怀疑,但金融界正在因AI的介入发生改变。
摩根大通、高盛等传奇投行钻营AI的消息连续曝光,而无论500%的收益率是否经得起推敲,它至少说明,GPT的能力开始渗入金融市场最前端的环节——交易。在Web3资产管理和投研机构的高管Rocky眼中,AI对“另类因子”的高效挖掘和优化已然发生。
在量化机构和对冲基金里,“另类因子”是所有策略因子中最稀有、珍贵的因子。它是指公司基本面、交易量、价格等常规因素之外的、影响行情的因素,比如社交舆情、市场情绪等。“顶级机构都在卷另类因子,”Rocky解释,量价因子和基本面因子不可避免地走向同质化,另类因子会起到决定性的作用,能帮助机构出奇制胜。
作为通用大模型,GPT想要直接用于量化投资还需使用者精细打磨,但新的大门已经打开。而对于普通人来说,借助ChatGPT高效地大量验证策略、分析数据后,也可以找到适合自己的生财之道。
AI的龙卷风终于刮到了离钱最近的金融市场。
“500%投资回报率”轰动世界
一直信奉科技力量的顶级投行摩根大通对AI出手了。5月26日,摩根大通宣布正在研发名为“IndexGPT”的金融服务工具,利用云计算和人工智能进行证券的分析和选择,为客户提供智能化和个性化的投资建议。
这是摩根大通又一次明牌将AI加入到交易系统。
早在2017年,摩根大通就开始使用内部代号为LOXM的人工智能工具,让机器从过去几十亿条实盘和模拟盘的历史交易中归纳经验和教训,然后以最快的速度和最优价格执行交易指令,从交易规模和效率上超越人类。
2019年,摩根大通更是网罗全球AI高手,开发“股票交易机器人”,主要功能包括生成投资报告、自动搜寻投资机会以及自动监控“报价请求”。当时,摩根大通称,自动化订单在过去几年中将交易执行成本降低了约20%。
如果摩根大通早期的AI投入意在“降本”,当GPT展现出超能力时,这家投行开始用最前沿的AI技术提升自己的“钞能力”。从布局脉络看,AI在摩根大通内部扮演的角色发生了重要改变——从投资助理蜕变为指导交易的操盘手。
摩根大通的新动作释放出AI深度介入金融业的信号,高盛、摩根士丹利也都被曝出在内部投入AI研发。
金融巨头搞AI的新闻在华尔街上演,并没引起大众注意。但来自佛罗里达大学金融系的一份研究报告,被人挑出亮点,一下打破了“AI改变金融圈”这种常规叙事下的审美疲劳。
那份以“ChatGPT能预测股价走势吗?”为题的高校研究报告,最初发布于今年4月6日,一开始也反响寥寥。直到5月份, Reddit上的一名科技作者推荐了这篇报告,他认为,这是一份被主流媒体忽视的论文。
“500%的投资回报率”入题后,瞬时引爆金融圈内外。
论文显示,佛罗里达大学的研究人员给不联网的GPT-3.5投喂了2021年10月至2022年12月的公开市场数据和新闻,这些数据通过网络爬虫获取,包含4138家上市公司相关的67586的标题,并排除了任何股票涨跌的头条,过滤掉了无意义的、热点话题、重复的新闻等内容。研究人员主要让 ChatGPT来评估每个标题,并要求它判定是利好还是利空。
这是典型的情绪分析,也是DE Shaw、Two Sigma 等知名对冲基金会采用的自动化交易策略的一部分。举个简单的例子,当一件事发生后,市场往往对其利多还是利空有分歧,准确的情绪分析有助于识别消息影响,做出正确的投资决策。
研究人员不厌其烦地让ChatGPT给出答案,最终他们得出了惊人的结论:擅长逻辑推理的ChatGPT 表现优于其他所有情绪分析工具。借助ChatGPT,研究人员回测了过去使用ChatGPT指导不同投资策略的回报表现,最终多空策略(买入有好消息的公司,卖空有坏消息的公司)收益率超过了500%,做空策略回报率接近400%,做多策略回报率大约为50%。
由 ChatGPT 驱动的策略表现
在证券市场,上述的任何一个回报率,都足以秒杀全世界99%的投资经理。研究报告指出,同一时间段内购买并持有标准普尔500指数ETF的回报率为-12%。
仅仅用ChatGPT进行情绪分析,就能带来如此高的回报率?这篇报告吸睛的同时也引发网友质疑,“如果你找到了一种能在不到 2 年内获得 500% 回报的策略,你会公开它吗?”还有人称,即便报告是真的,但一旦一种策略广为人知,它就不再有效,“天下没有免费的午餐。”
AI升级另类因子“挖掘机”
外行看热闹,内行看门道,消息传到Rocky耳中,他兴奋极了。
Rocky是一家Web3资产管理和投研机构的高管,他直言被佛罗里达大学的这份研究报告“惊呆了”,他认为,ChatGPT的加入让“另类因子”的挖掘和优化有了质的飞跃,他给出结论:“交易员已死,AI+投资是未来。”
Rocky解释,以前他们研究量化,有两点是最难的,第一个是数据源,第二个是策略因子。常见的策略因子包括量价因子和基本面因子,最后同质化都比较严重,“最终考验的是另类因子博弈。”
策略因子是量化机构中的常见概念。简单理解,机构拿到二级市场的成交数据、资讯舆情等数据后,会对它们清洗,然后将海量数据处理成一个个因子。这是一个从海量信息中找到影响市场的重要因素的过程。把这些因子融入到交易策略里,能帮交易员判断行情涨跌。
有效的策略因子意味着“金矿”,挖掘到了,回报就不是难事。
如Rocky所说,策略因子中,量价因子、基本面因子和另类因子三者在量化策略里的占比大致是60%、20%、20%。其中量价因子基于市场成交量的数据挖掘而来,包括每分每秒的资产价格、资金流向、各类K线的技术指标等等;基本面因子则来源于财务报表、券商报告、分析师预期等等;而另类因子则是前两者之外的“秘密武器”,各家机构会利用自己独到的能力采集包括社交舆情、门店数据等影响价格的因素。佛罗里达大学研究人员让ChatGPT做的“情绪分析”就属此类。
常见的策略因子(红岸研究整理)
一般来说,量价因子和基本面因子,很难拉开机构间的差距,因为这些信息都是固定且公开的,而挖掘到另类因子更考验机构功力。“现在顶级对冲基金都在卷另类因子”,Rocky告诉《元宇宙日爆》,高手对决,常规招式很难奏效,奇招才能致胜。
但另类因子的挖掘成本和难度远高于量价因子和基本面因子。
“就像在无边的沙滩上捡贝壳,需要非常耐心地一个个捡。通常某类的另类数据,只能覆盖到其中某些板块,哪怕挖掘到了,也只能获得这些板块上的收益。”蒙玺投资总经理李骧称,另类因子光数据收集就有一定门槛,因为它不是常规的数据,要么从第三方数据提供商购买,要么自己收集,甚至为了发现更优质的数据,机构还需要主动去挖掘有价值的数据供应商。
在采集到数据后,研究另类数据也不简单。“如何挖掘数据的内部逻辑,这一步也有较高门槛。”李骧说,这个过程非常精细,需要剔除各类噪音,找到内在逻辑,再进行因子组合,一系列操作完成后,才可能有不错的效果。
李骧把收集因子的过程比喻为“挖矿”:最开始把地表层面的一些矿、比较好收集的先收集进来,然后越挖越深。
在另类因子挖掘方面,往往是各大投资机构最费人力、财力也是最核心的工作,他们大批量地搜集情报,逐一分析价值,回测收益率、试错,庞杂的工作量后可能一无所获,收获有效的另类因子有时候还需要些运气成分。
如今,ChatGPT的出现让挖掘另类因子的过程变得高效。“它文本到文本的功能很强大,比如我们利用自然语言处理技术,可以抓取网友对某一类股票,甚至某一只股票的观点。”李骧认为,GPT的跨越式发展,可以提升一些辅助型工作的效率,比如在预测维度方面,“它对量化研究的增益是在数据收集端,利用ChatGPT可以更好地获取文本端信息。”
不过,GPT更像一个通用大模型,并不偏向金融专业,这注定了它还不能即拿即用。Rocky称,基于GPT大模型做的数据投喂,属于“普世模型“,无法满足金融横截面与时间序列数据的真实性、有效性、实时性,在数据清洗环节,还需要专业的小模型做预处理和标准化,这表明ChatGPT离专业量化之路还有距离。
但Rocky认为, ChatGPT已经为机构们开辟了一条显而易见的门道,AI可以成为交易员的高能助手。
普通人的财富机会来了?
佛罗里达大学的研究报告像是一个引子,足以让摩根大通们灵光乍现。AI很可能成为交易市场中没有感情的“赚钱机器”,与真人展开金钱博弈。
那么,普通投资者能否借助ChatGPT这样的工具,参与量化交易,提升自己的收益回报?
对此,Rocky觉得还不现实。他解释,做量化交易需要有金融工程专业背景,得具备高等数学、统计概念、金融知识、衍生品知识、金融法规等知识储备。同时,GPT这个大模型数据库,没有实时性,必须从Bloomberg等处购买数据源,不然数据都是非实时的,没法参与博弈,“Bloomberg一个终端就十几万美金了,门槛太高,散户用GPT跑个收益回测还可以,实战就别想了。”
金融市场波谲云诡,普通投资者对工具的使用应该尤其谨慎,一旦被高阶的工具识破底牌,恐怕会成为任人宰割的羔羊。不过,也有人提供了更适合普通人的投资思路,高收益恐怕做不到,但还是很有机会跑赢房贷利率。
小程序“阿牛数据”的创建者牛亦飞一直在从事低频量化交易,不久前,他做了一个实验,让ChatGPT写一个量化策略,并回测出收益率曲线。
牛亦飞给ChatGPT提供的策略逻辑是:从上证50、创业板指、10年国债这3个指数的ETF中,每天选出近1个月(22个交易日)涨幅最大的那只,如果已经持有该基金则继续持仓,如果未持有,则清仓持有的基金全仓买入该基金,如果这3只基金近1个月都下跌就清仓。
用ChatGPT编写量化策略代码过程
很快,ChatGPT给出了相应的策略代码和注释。“唯一不足的是没有给出数据源,好在我存有一份基金历史数据,引入数据运行后,果然可以看到每日持仓的结果了”。
随后,牛亦飞需要验证策略的历史表现,于是让ChatGPT生成回测程序,要求回测出策略的区间收益率、年化收益率、最大回撤等,几秒钟后,AI就给出了程序代码,并把要求的指标的实现了。“不过,在仔细查看程序后,还是发现细节上存在一点瑕疵,例如没有考虑实际调仓时间等问题,不过整体完成度已经超过90%了。”
牛亦飞称,它又通过引导AI优化了程序,并手动简单魔改,回测程序就做好了。他用该程序回测了2022年使用上述策略的投资表现,最终得出区间收益率9.18%,年化收益率9.57%,最大回撤幅度-12.25%。对比专业的统计工具,ChatGPT出品的回测程序净值曲线几乎一模一样。
在这个案例中,牛亦飞是主动定了投资策略,并让ChatGPT做出自动化投资软件和回测程序,其实是把写代码的工作交给了ChatGPT。当然,ChatGPT写代码的高效率远远超过人类工程师,这使得普通投资者可以借此方法,高效地大量验证策略的有效性,进而不断优化交易策略,以提升收益率。
在牛亦飞的简单实践中,其投资年化收益达到9.57%,远远高于一般的银行理财产品。牛亦飞向《元宇宙日爆》透露,除了让ChatGPT写代码外,他也在尝试用AI做数据分析、财报和公告分析等,让其给出交易信号。
李骧也认为,ChatGPT将一定程度降低量化行业的门槛。有人如果对量化行业感兴趣,即使没有从业经验,只是在交易上有些想法,也可以借助ChatGPT的能力部分参与进来。“但是,从这种状态到成长为一个非常专业的量化机构核心研究员,将策略做得很精致、细节做得很完美,依然有很长一段路要走。”