文章主题:关键词:ChatGPT, 股票投资, 情感分析, 金融行业
新智元报道
编辑:润 拉燕
【新智元导读】论文教你用ChatGPT炒股,收益最高能到500%!
ChatGPT,要把人类基金经理也给替代了?
一篇关于金融领域的文章报道了这样一则消息:英国金融咨询网站Finder在3月6日尝试了一个创新性的投资策略,他们选择了由人工智能助手ChatGPT选定的股票组合。经过两个月的运作,这个投资组合的收益成功地达到了4.93%,这无疑是一个令人振奋的成果。这一实验的成功,不仅展示了人工智能在金融领域的巨大潜力,同时也为投资者提供了一种全新的、高效的选股方法。
在同期的这段时间内,英国十大热门基金的平均表现仅为-0.78%,而在87%的交易日内,其表现均未能达到「ChatGPT指数」的水准。这无疑是一个值得关注的现象,因为它揭示了这些基金在市场中的不稳定性和相对较弱的竞争力。
同样的,同期标准普尔500指数(包含美国最有价值的500家公司的指数)也只上涨了3%。
难道除了文字工作者们的岗位受到了威胁之外,「打工人」的脸面——基金经理们也要失业了吗?
未曾设想的道路
谁能想到,国外研究者还真整了篇论文出来,细致入微地探索AI炒股的能力。
具体而言,我们需要向ChatGPT提供一些新闻标题,并让它运用情感分析(Sentiment Analysis)技术来评估这些事件对股市产生的影响。
ChatGPT能够辨别某事件对股票价格的影响是积极、消极还是无影响,然后研究者根据这一结果为其打分。通过观察真实股市回报,可以评估ChatGPT的准确性。
研究人员表示,ChatGPT要比别的模型强多了,像什么GPT-1、GPT-2都预测的不准。
股市回报预测能力对于语言模型而言,是一个急待深入研究的课题。同时,具备更高级别的语言模型,无疑能够生成更为精确的预测结果。
在本研究中,我们的研究团队采用了三个关键数据源来深入挖掘市场动态和投资策略。这三个数据集包括:证券价格研究中心(CRSP)每日收益率汇总,涵盖我国A股市场的整体表现;各大新闻头条,为我们提供了实时、全面的资讯来源,以便捕捉到潜在的市场变化和政策影响;此外,RavenPack作为一个独特的研究工具,帮助我们从不同角度分析市场趋势和投资者行为。通过结合这些数据集,我们将更好地理解市场动态,并为投资者提供有价值的建议。
而数据样本的覆盖范围从2021年10月开始,到2022年12月结束。
选择该时间段的原因非常明确。由于ChatGPT自身的训练数据截止于2021年9月,因此在此之前的数据对于其预测已经没有太大的参考价值。换言之,ChatGPT在2021年10月之前已经具备了一定的知识体系,对于这一时间段内的数据,它可以直接忽略。相反,选择2021年10月之后的新数据可以让ChatGPT有机会进行实际操作和锻炼,从而更好地提高其性能。
CRSP的每日收益数据集是包含美国主要证券交易所上市各类公司股票的每日收益率、股票价格、交易量以及市值等重要数据的三大数据集之一。
其次,研究者搜集所有包含有公司名称或者股票代码的新闻,来源则是各类主要的新闻机构、金融新闻网站和社交媒体平台。
对于每家公司而言,研究人员会收集样本期间的所有新闻。
最后,RavenPack值得着重介绍一下。
自2003年以来,RavenPack一直是金融服务领域领先的数据分析供应商之一。
他们帮助企业从大量的信息中快速而轻松地有价值的部分。RavenPack的产品使客户能够提高收益、减少风险并提高运营效率。
总的来说,RavenPack的作用,就是保证喂给ChatGPT的都是有效/相关的信息。
最终,研究团队从RavenPack上匹配出4138家公司的67586条新闻标题。
同时,研究人员会给每条新闻打分,从0到100,衡量每条新闻和所提及的公司的关系。
0分意味着在新闻中是被动提到某家公司的,可能只是捎带手提了一嘴。研究人员追求的是100分的相关性。
同时,所有只介绍股市趋势的新闻也排除在外,这种新闻违背了预测的初衷。相同内容的重复报道也被研究团队规避,这样收集到的数据才能为实验更好的服务。
到这里,该收集的数据就差不多了,下一步就是该分析了。
打分制炒股
既然要让ChatGPT输出内容,那首先就是设计一个prompt出来。
研究团队使用的是以下这个prompt:
假设你是一个金融专家,且是一个有股票推荐经验的金融专家。如果这条新闻是好消息,请回答「YES」,如果是坏消息,请回答「NO」,如果不确定,请在第一行回答「UNKNOWN」,然后在下一行用一个短小精悍的句子进行阐述。
这个新闻对 _____(公司名称)的股票价格来说,在 _____ 内(短期、长期)是好是坏?
新闻标题:_____
可以看到,研究人员让ChatGPT Cosplay一个有股票推荐经验的金融专家,而横线的部分则用具体信息替代。
举个栗子:
输入新闻标题:Rimini Street在与甲骨文的诉讼案中被罚63万美元
评价对象:甲骨文股价
时间跨度:短期
ChatGPT输出的回答是这样的:
「YES。对Rimini Street的罚款会间接促进投资者的信心,相信甲骨文有能力保护自己的知识产权,维护自身产品和服务的需求提升。」
然后,研究人员会根据ChatGPT的回答进行打分。YES算1分,NO算-1分,UNKNOWN算0分。
如果关于一家公司一天之内有很多新闻,那就把分数汇总一下,输出一个平均值。
最后,再用这个预测的分数和之后真实的结果进行匹配。
散户福音!
通过利用新闻标题数据和生成的情绪得分,研究人员发现ChatGPT评估结果与样本中股票的后续每日回报之间存在很强的相关性。
而且ChatGPT的情绪评分比现有的传统的数据供应商提供的情绪指标还要能更加准确地预测股票的收益。
研究团队认为,ChatGPT之所以比现有的情绪指数好,还是要归因于强大的语言理解能力,使得它能够捕捉新闻标题中的细微差别,从而使得生成的情绪得分更为可靠。
所以将大语言模型作为工具能够提供比传统的情绪指数更好的投资参考。
研究团队还进一步发现,ChatGPT情感评分对于小盘股的收益预测能力要好于大盘股。说明对于股东套利的限制可能会降低这个策略的收益能力。
研究团队用ChatGPT生成的情绪的分来指导股票操作。
具体操作方式就是,只要有消息放出,就买入(积极消息)或者短暂卖出(消极消息)股票。
消息如果是交易时间内放出,就以当时价格进行交易,如果是交易时间之外放出,就以第二天开盘价进行交易。
(黑线代表零成本的收益,绿线代表5%的交易成本的收益,蓝线代表10%的交易成本收益,深蓝色的线代表25%的交易成本收益,红线代表市场整体收益)
这个表展示了操作的回归分析的结果,很直观地体现了第二天股票收益与ChatGPT生成的情绪得分之间的相关性。
回报率500%!?
用ChatGPT对新闻标题进行情感分析,从而预测股票收益的表现是优于主要供应商的传统情绪指数的。
说明了继续开发探索大语言模型在金融行业的应用是非常有潜力的的。
随着AI本身技术的发展,设计更复杂的模型在金融市场搞钱是一个很靠谱的事情。
宏观来看,考虑到未来如果大部分金融从业人员都使用基于大语言模型的工具进行决策,也会对金融市场的价格的形成机制,信息的传播途径,和市场稳定性产生深远的影响。
那么,具体的回报是什么样子的呢?
多空策略,即购买有好消息的公司并卖空有坏消息的公司,回报率最高,超过500%。
只做空策略,只关注卖空有坏消息的公司,回报率接近400%。
只做多的策略,只买入有好消息的公司,回报率约为50%。
当然,这个数字看着唬人,其实也就是一个理想情况。
但是,抛开冷冰冰的数字,ChatGPT的这项能力确实有很大的发挥空间。
这可能会改写股票交易,散户现在有机会获得比企业情绪分析更强大的工具。
一般来说,ChatGPT正在使其他公司倾注在专有机器学习模型中多年的工作变得过时。
它跨越了数百万美元的研发费用,任何人都可以轻松获得这种能力。
对于普通投资者来说,跑赢大盘就挺好。
对于没有很复杂金融知识和股票交易的经验的普通人,当然做不了如此复杂的分析和精度很高的操作。
那么根据开头提到的跑赢标普500的「ChatGPT投资组合」中推荐的选股策略:
低负债率
历史上持续稳定的增长
拥有能够产生竞争优势的资产。
也能挑选出不错的公司,帮助你高效配置自己的资产。
但需要注意的是,ChatGPT给出的回复并不能作为投资的事实性依据。
参考资料:
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4412788
https://www.reddit.com/r/ArtificialInteligence/comments/13dufss/a_chatgpt_trading_algorithm_delivered_500_returns/
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!