大语言模型、文本情绪与金融市场

作  者:

作者简介:
姜富伟,厦门大学经济学院、厦门大学王亚南经济研究院;刘雨旻,中央财经大学金融学院;孟令超(通讯作者),对外经济贸易大学中国金融学院。

原文出处:
管理世界

内容提要:

“人工智能+”行动是发展新质生产力的重要途径,其在金融领域的应用有助于金融强国建设。本文创新性地融合结构化金融市场数据和非结构化金融文本大数据,并结合中国特色金融市场的独特特征,训练了一个更适用于我国金融领域的中文金融大语言模型,并开展金融市场情绪测度和资产价格风险预测。研究发现,与传统字典法相比,使用中文金融大语言模型构建的大模型情绪在金融市场回报预测方面表现显著更佳。大模型情绪对很多宏观经济变量也有显著预测能力,能够捕捉非理性情绪冲击对宏观经济基本面的影响。大模型情绪在经济下行和极端风险事件期间的预测效果更强,契合了金融理论中非理性情绪对金融市场和宏观经济会产生非对称与非线性影响的结果。综上,本研究展现了“人工智能+”行动在我国金融领域应用落地的潜在技术路径和理论逻辑。


期刊代号:F63
分类名称:投资与证券
复印期号:2024 年 12 期

字号:

  一、引言

  人工智能是当前全球科技创新发展的最前沿,在我国经济与金融业数字化转型中扮演了重要角色。在此背景下,2024年国务院《政府工作报告》指出要“深化大数据、人工智能等研发应用,开展‘人工智能+’行动”,这是发展新质生产力的重要途径,党的二十届三中全会指出“要健全因地制宜发展新质生产力体制机制,健全促进实体经济和数字经济深度融合制度”。开展“人工智能+”行动,促进实体经济与数字经济相融合,为包括金融业在内的各行各业高质量发展提供了新方向。尤其是,以BERT、ChatGPT等为代表的人工智能大语言模型迅猛发展,体现出了广阔的应用前景。思考如何开展“人工智能+金融”垂直领域应用研究,对做好科技金融、数字金融等5篇大文章,发展新质生产力与推动金融强国建设都具有重要意义。为此,本文从金融市场非理性情绪测度的角度出发,结合中国特色金融市场的独特特征,构造了适用于金融领域的中文金融大语言模型,并探讨了“人工智能+”与金融应用相结合的路径和逻辑。

  从历史上的1637年荷兰郁金香泡沫到近期的2020年新冠疫情暴发,一系列极端事件都表明金融市场受到投资者非理性情绪的严重影响(夏皮罗等,2022)。金融市场均衡与资产价格不仅取决于经济基本面等内在价值,还会受到投机情绪的影响,这在以个人投资者为主体的中国市场上表现尤为突出(陈彦斌,2005)。受非理性投机情绪驱动的噪音交易会使得金融资产价格偏离其内在价值,并导致金融泡沫的快速膨胀与惨烈破裂,影响金融稳定(游家兴、吴静,2012)。因此,情绪成了金融学术和政策研究的重要话题。然而,情绪作为一种主观信念,难以使用传统的数据与方法加以准确测度,如何准确测度金融市场情绪因而成了一个重要的基础性学术研究问题(贝克、沃格勒,2007)。

  现有文献中的情绪测度主要分为基于市场交易指标构建和基于词典法构建两类。首先,部分市场交易指标与市场情绪变化紧密相关,可以从中提取情绪信息(贝克、沃格勒,2007)。该方法有数据可得性强的优势,但由于市场交易指标还受其他因素影响,该方法难以准确反应情绪变动。其次,越来越多的文献尝试通过字典法从非结构化文本大数据中提取市场情绪信息,使用的文本数据包括媒体新闻(姜富伟等,2021b;汪昌云、武佳薇,2015;张琦等,2016;张成思、芦哲,2014;张晓燕、葛慧敏,2022)、上市公司报告(谢德仁、林乐,2015;曾庆生等,2018;胡楠等,2021)、社交媒体文本(张紫琼等,2010;姚加权等,2021)、货币政策报告(姜富伟等,2021a;林建浩等,2021)等。然而,理论表明,投资者情绪不仅能够对资产价格造成影响,还能通过资产价格影响实体经济波动,且彼此间不断复杂交互(贝克、沃格勒,2007;本哈比等,2016)。因此,投机情绪、金融市场与实体经济之间的关系存在复杂的非线性与非对称特征(夏皮罗等,2022)。现有文献采用的文本字典法是简单的线性方法,难以刻画非线性与非对称的市场情绪动态变化,并受字典设定质量影响较大,还忽略了上下文等其他维度的文本信息,因此亟待改进。

  为解决上述问题,受到“人工智能+”行动启发,本文创新性地将人工智能大语言模型与中国特色金融市场独特特征相融合,训练了一个中文金融大语言模型,实现了对金融市场情绪的更准确测度。大语言模型是近年来自然语言处理与人工智能领域研究的最新突破,其本质上是一个规模极大的深度学习模型,通过数以亿计的参数全面训练并刻画文本特征,典型代表是谷歌公司推出的BERT模型和开放人工智能研究中心(OpenAI)的ChatGPT模型。由于大语言模型参数规模的庞大性,其通常也被简称为大模型。大模型在捕捉非线性关系中具有突出优势,与金融理论模型中情绪与资产价格之间的非线性与非对称关系十分契合。此外,我国资本市场具有鲜明的中国特色,起步晚、发展快,以个人投资者为主体,具有较强的投机性和不稳定性。为了更准确地测度我国金融市场的非理性投机情绪,本文创新性地引入了以BERT(Bidirectional Encoder Representations from Transformers)为代表的深度学习和大语言模型,将市场回报作为情绪标签变量引入到大模型训练中,创新融合结构化市场数据和非结构化文本数据,训练了一个更具有中国市场特色的中文金融大语言模型,构建能反映我国金融市场非线性与非对称特征的大模型情绪测度。

  具体来说,本文利用2003-2021年间的五百多万条媒体新闻文本大数据,训练出本文提出的中文金融大语言模型,计算大模型情绪测度指标,开展金融市场资产价格风险预测实证检验。本文还使用姜富伟等(2021b)的金融文本情感字典计算字典法情绪,以作为对比。实证结果表明,基于中文金融大语言模型构建的大模型情绪指标在样本内与样本外预测检验中都表现出了远优于字典法情绪的预测能力,并且在资产配置中能够获得更好的收益。进一步分析发现,基于大模型构建的情绪指标还能准确预测宏观经济变量,且在极端事件期间对市场回报有着更强的预测能力。上述结果表明大模型情绪很好地契合了金融理论模型中非理性情绪对金融市场和宏观经济会产生非对称与非线性影响的理论预测。

  本文主要的贡献在于:(1)本文训练了一个适用于我国金融市场情景的中文金融大语言模型,改进了文本大数据情绪测度在我国金融市场的应用效果。本文的中文金融大语言模型基于BERT模型构造,现有文献的探索多针对英文文本(黄等,2023;杨等,2020;刘等,2021)。少数在中文语境下应用BERT模型的文章关注点集中于提升情绪分类精确度(许雪晨、田侃,2021),缺乏对大模型情绪测度与我国金融市场特色的深入关联。本文有力补足了上述文献研究中的不足。(2)本文借助大语言模型的深度学习算法优势,识别我国金融市场复杂的非线性与非对称情绪特征,构造了更加符合金融理论的情绪变量。本文发现大模型情绪变量在极端事件期间可以更好地预测市场回报,并能够预测宏观经济状态,展现了大模型与金融理论的高度契合。(3)本文将柯等(2019)和周等(2024)的以金融市场回报为情绪标签的做法,与大语言模型的微调技术相结合,在充分利用大语言模型非线性优势的同时,进一步结合市场回报中蕴含的结构化情绪信息进行训练。总之,与现有文献使用词典法或人工标注训练大语言模型相比(黄等,2023;杨等,2020;刘等,2021;石等,2022),本文做法与经济金融理论模型更加契合,构造了一个与中国特色金融市场关联更加紧密的大模型情绪测度,为理解深度学习和人工智能大模型为何在金融应用上表现优越提供了新的经济学见解,探索了“人工智能+金融”行动的潜在技术路径和理论逻辑。

相关文章: