1 引言 心理理论(Theory of Mind,ToM)指个体对自己或他人内部心理状态(包括愿望、信念、知识、意图等)的理解和推测,及由此对相应行为做出的因果性解释与预测,是社会认知(Social Cognition)和社会互动的基石(Premack & Woodruff,1978;Wellman,2017)。长久以来,心理理论被认为是有意识的生物独有的社会认知能力(Yıldız,2025)。然而,人工智能(Artificial Intelligence,AI)的不断发展,尤其是近年来诸如GPT、Claude、DeepSeek等大语言模型(Large Language Models,LLMs)的迅速进展,重新塑造了人们对AI能力边界的认识。一项研究发现,GPT-4在改编版错误信念(False Belief)任务中的通过率达到75%,与6岁儿童的心理理论表现相当,表明LLMs可能自发涌现出心理理论(Kosinski,2023)。该研究凸显了将心理理论等社会认知能力整合到LLMs中,以实现更自然的人机交互的潜力,同时引发了关于LLMs人工心理理论(Artificial Theory of Mind,AToM)的激烈争议。 模拟人类认知是AI研究的核心目标之一(Deshpande & Magerko,2024),该领域对心理理论的研究主要沿两个方向展开:其一,基于特定算法训练能够模拟心理理论的AI模型,通常被称为机器心理理论(Machine Theory of Mind)方向;其二,研究未经特定训练的LLMs能否以及如何涌现出心理理论,通常被称为人工心理理论方向。机器心理理论研究主要聚焦于两类模型的构建:基于贝叶斯方法建模人类心理状态的因果关系,即通过行为观察间接推断心理状态(Baker et al.,2011;Yuan et al.,2022);基于深度学习(Deep Learning)范式,建立行为与心理状态间的直接映射关系(Rabinowitz et al.,2018;Sclar et al.,2022)。两类模型各有优势,前者具有较好的解释性,后者能够反映内隐的心理状态。然而,它们仅能解决特定的心理理论任务,尚不具备人类水平的心理理论能力(Mao et al.,2024)。而人工心理理论研究的兴起,源于LLMs经规模扩展后,涌现出一些未通过针对性训练而获得的、小型模型不具备的能力(舒文韬等,2023;Wei,Tay,et al.,2022)。使用心理学行为任务评估LLMs,分析任务输入与模型输出间的映射关系,能够解构其表现及内在机理(Hagendorff,2024)。人工心理理论研究遵循这一思路,研究者使用改编或定制(ad-hoc)的心理理论任务评估LLMs,推断其是否具有心理理论。然而,现有研究的结论存在分歧。例如,Trott等人(2023)采用改编版错误信念任务评估GPT-3,其通过率为74.5%,与Kosinski(2023)研究中GPT-4在同类任务中的通过率(75%)几乎一致,但两项研究对LLMs是否具有心理理论持相反观点。这也引出另一问题:仅通过模型在任务中的表现,能否判定其人工心理理论类似于人类心理理论?有研究者通过细致反思Kosinski(2023)实验的结构和方法,提出LLMs能够表现出类似人类的心理理论能力,但不具备与人类相同的心理状态和过程(赵泽林,程聪瑞,2024)。 此外,目前对LLMs心理理论的术语界定尚未达成统一共识。一方面,机器心理理论、神经心理理论(Neural Theory of Mind)和人工心理理论被混用于描述LLMs的心理理论。其中,机器心理理论侧重基于特定算法,使用非常有限的数据开发能够模拟人类心理理论表现的AI模型(Lebiere et al.,2025);神经心理理论强调机器理解和追踪他人心理状态的能力(Xu et al.,2024);人工心理理论则关注人机交互中智能体(Intelligence Agents)的心理理论(Williams et al.,2022;Winfield,2018),强调LLMs对人类心理理论表现的模拟(Bendell et al.,2024;Marchetti et al.,2023)。鉴于LLMs本质上是基于海量文本进行无监督训练的深度学习系统(Blank,2023),其未经针对性建模便可通过多种心理理论任务,但尚不明确模型能否理解和追踪他人的心理状态(Jin et al.,2024),因此使用人工心理理论较为合理。另一方面,人工心理理论作为研究实践中逐渐形成的共识性术语,其定义尚不完善。Marchetti等人(2025)将人工心理理论界定为:LLMs在心理学研究所确立的心理理论任务中,表现出与人类一致反应的能力。然而,该定义仅聚焦于LLMs在心理理论任务中与人类表现的一致性,尚未明确人工心理理论与心理理论的差异,并不足以界定人工心理理论。 综上,针对当前人工心理理论研究存在的问题,本文首先系统梳理了相关实证研究文献,通过综合分析GPT-4在心理理论任务中的较高通过率及使其表现受限的内外因素,指出当前LLMs具有在表现上与心理理论相似的人工心理理论。其次,本文通过深入对比支撑心理理论与人工心理理论的神经基础和发展因素,揭示二者的内部过程存在本质差异,并根据此差异补充了人工心理理论的定义。最后,本文总结出在评估方案、人工心理理论机制与心理理论对齐三个方面的挑战,并提出了相应展望:制定并采用标准化的评估方案,在共同心理理论框架下探究人工心理理论机制,以及与人类心理理论对齐。 2 大语言模型具有人工心理理论的证据 为全面分析LLMs在心理理论任务中的表现,本文系统检索了自transformer架构提出后(Vaswani et al.,2017),2017-2025年间的相关文献。英文数据库(Web of Science)中以关键词“theory of mind”“artificial theory of mind”“machine theory of mind”“neural theory of mind”与“Artificial Intelligence”“Large Language Models”“AI”“LLMs”“ChatGPT”之间组合的方式进行检索。检索截止日期为2025年6月,共检索到409篇文献(文献检索与筛选流程见图1)。随后从评估对象和任务特征两个方面进行整理(见表1)。