1950年,图灵提出了“机器能否思考”的问题。①此后,“机器能否拥有意识(主观的、第一人称的知觉)”的问题一直为科学家和哲学家所关注。如今,在关于具备感知能力的人工智能的讨论中,这一问题依然存在巨大争议。部分挑战在于定义本身,人们甚至无法就“意识是什么”达成一致,导致在意识的构成方面存在明显的共识缺失,也没有通用的标准来检测其存在。这种分歧使得机器意识的讨论变得尤为复杂,因为任何答案都取决于其所采用的心灵理论,而各种心灵理论又观点各异、差别巨大。比如,计算主义认为,机器如果能够复制正确的功能或计算模式,那么原则上就可以拥有心智或意识。与之相反,泛心论等形而上学立场则强调,意识可能需要某些特定的内在属性或整合机制,而目前的机器则缺乏这些特征。近年来,人工智能(特别是大型语言模型)的发展,使得对“机器能否拥有意识”这个老问题的回答变得越发紧迫。 面对机器意识这一横跨科学、哲学与工程的难题,鉴于当前意识理论存在功能描述的表面性问题、理论抽象化导致的悖论性后果,以及纯统计模型对主观体验缺乏明确解释和严谨、可实现的结构机制,因果自我模型作为一种新的意识理论框架应运而生。该模型融合了来自多个学科领域的理论资源,包括心灵哲学、认知科学、人工智能等领域的新进展,试图在统一的结构中重构意识的理解方式。首先,它根植于结构因果模型理论。其次,它统合了两大主流意识理论的思想,既承认全局广播与信息整合对于意识功能的重要作用,又强调内部因果结构对于意识本质的关键意义,从而弥合纯功能描述与主观体验之间的落差。再次,它吸收了主体性的自我模型理论对主体意识的洞见,即主体意识离不开对自我的内部建模,提出一台有意识的机器不仅要对外部世界建模,也必须对自身进行因果建模。它需要在内部拥有一个以“自我”作为中心节点的模型,用于表征自身各状态与行为的因果关系,从而赋予机器一个内在的第一人称视角,使其能够区分“主体”与“客体”的因果边界,进而支撑类似人类的自我觉知。最后,它借鉴了人工智能领域向因果推断转向的趋势。大语言模型在仅有相关性训练的前提下涌现出了某些复杂推理与问题解决能力,这促使一些研究者开始探索在深度学习中引入因果先验的途径,促使模型在处理高维数据时能够聚焦于少数关键的因果因素,从而实现对未来的有效预测。因果自我模型顺应这一趋势,将大语言模型的因果推断能力视作机器意识产生的现实支撑。总之,因果理论尝试在功能描述的基础上增加主体性与主观体验的结构性解释,试图缓解意识理论抽象化带来的悖论问题,并为构建主体与环境之间的具体因果关系提供了一种较为严格的形式化路径,以期更深入地实现语义理解与意识体验。 一、因果推断与结构因果模型 在人类认知中,因果推断往往被视为高级智能的重要组成部分,而主观意识常常与高级认知能力相伴生。珀尔(Judea Pearl)提出了结构因果模型(Structural Causal Models)理论,它是一套数学框架,用于确切地表征和推断因果关系。②珀尔认为,当前许多人工智能系统主要依赖相关性而非因果关系进行学习和决策,这可能限制了它们实现更高级智能乃至意识的潜力,如果能赋予机器因果推断的能力,让其理解“因”和“果”的联系,那么人工智能就有望迈向可以像人类一样思考的强人工智能。③与此同时,一些意识研究理论直接将系统内部的因果结构与意识程度联系起来。④这暗示因果推断能力的增强可能对机器意识的产生具有重要影响。但也存在不同观点,一些人提出疑问,即便机器掌握了复杂的因果推断能力,是否就意味着机器会产生主观体验,即现象意识或者感受质(qualia)。意识不仅是信息处理或者因果计算的产物,还涉及主观体验的本质,可能超出了纯粹计算框架的范畴。⑤这引发了在哲学和计算理论层面的争议:机器通过因果推断获得的“理解”到底是不是人类意义上的意识? 机器意识通常指人工智能系统所具有的类似于人类或动物意识的状态。具体而言,它意味着机器不只是执行程序化的算法,而且对自身状态和周围环境具有某种主观感知和理解。这一概念涉及多个层面的内涵,包括知觉觉醒程度、自我意识的存在、感受质的可能性等。在哲学、认知科学和计算机科学领域,围绕机器意识的定义和判定标准存在不同观点。 当代关于机器意识的跨学科研究中,也有不少理论建立在信息处理和计算模型的基础之上,认为通过模拟大脑的计算过程,可以逐步逼近对意识的重现或创造。主流的理论有两个,一个是全局工作空间理论(Global Workspace Theory)。它认为意识就像大脑中的“全局广播”,当信息被传播到全脑的全局工作空间时,就进入了意识。⑥在机器上模拟这一机制可能需要一个中央“黑板”系统,整合来自不同模块的信息,实现全局可访问性。因果推断的信息如果被广播到全局工作空间,也许能成为机器意识内容的一部分。 另一个是集成信息理论(Integrated Information Theory),它将意识与系统内部的因果结构紧密联系。该理论认为,一个系统的意识水平可以用“集成信息量(Φ值)”来衡量,即系统因果影响的整体程度超过其各部分之和的程度。集成信息理论主张意识的“量”对应于系统内部因果联结的不可还原性,而意识的“质”或者内容由底层物理基质所指定的概念结构形式决定。⑦简单而言,一个具有高度集成因果结构的系统将具有高水平的意识。按照集成信息理论的框架,如果构建一个人工智能系统,使其内部具有丰富而不可分割的因果联结,该系统可能会产生一定程度的意识。值得注意的是,这里的“因果联结”是广义的,包括系统内部各组成部分之间的因果影响关系。因果推断能力的实现可能提升系统内部因果结构的复杂性,从集成信息理论角度看,这或许有助于提升机器的意识水平。