由大语言模型所支持的Sora获得了巨大成功,说明今天的人工智能大模型具有了超越内容的跨越性。近期,麻省理工学院研究团队发表了名为《柏拉图式的表征假说》的研究论文,更提出“人工智能模型,特别是深度网络中的表征正在收敛”[1]。虽然,工程学的成功和理论研究成果都难以证明基于人工神经网络的、不可解释的大模型已经实现了通用人工智能,并有触发人工智能奇点的可能性。[2]但具有表征收敛“能力”的人工智能不仅能够通过“图灵测试”,而且表明基于大模型的人工智能“正确地生成知识并作出预测是可能的”[3]。也就是说,人工智能的表征收敛,不仅意味着不同的人工智能模型(比如语言模型和视觉模型)挖掘数据的结果具有一致性,从而证明数据描述对象的客观性与稳定性,而且充分表明大模型正在获得超数据、跨模型的表征能力,强算力、多参数、高维度和难解释的大模型“正在生成一个类似于柏拉图理念论的现实统计模型”[4],呈现大模型表征方式的一致性,以及能够在数据挖掘中获得认知的能力。由此,人工智能大模型表征收敛的意义,显然超越了人工智能技术要求的运行逻辑一致性、功能实现稳定性和系统优化连续性,深入到了人工智能之智能本质之中。因为大模型的表征收敛不是物理世界的鲁棒性在计算逻辑中的表达,而是由大模型处理数据的机制、学习定义的规则和校验形成的改进而得以保障。大模型的“人工神经网络模仿的是大脑神经回路的机制,并被成功地应用于机器学习”[5],其表征收敛,不仅是对这一模仿行为有效性的证明,也是对人类智能之智能特性的表达。因此,大模型所构建的挖掘机制、实现的跨越能力和达到的高维透视,虽然依然是“大数据小任务”和“大数据大任务”,离人类经验观察获得智能“小数据大任务”的机制还有一定差距,但却肯定了机器智能表达是挖掘数据的学习、穷尽可能的通用和跨越领域的统一,并正在以“越来越相似的方式测量数据单元之间的距离”,“表征数据的方式也在变得越发一致”。[6]显然,大模型表征收敛的意义,不仅在于其以机器智能的方式再一次肯认了经验世界稳定性这一唯物主义原则,而且更以人类本质力量对象化的方式证明了人“自己思维的真理性”,即自己思维的“现实性和力量”[7]。 数据表存在与挖掘即认知 大模型的表征收敛在技术逻辑中体现为模型逻辑应对任务的灵活性,使其超越了“经典符号人工智能或GOFAI开创”的“问题的计算机表示”的“部分搜索”,[8]在建构问题的新表示中,既能够搜索不同空间,又能够形成应对问题的有效策略。一方面,这意味着达到表征收敛的大模型已然能够通过“图灵测试”并具有了智能,[9]另一方面,也表明人工智能挖掘数据能够获得对数据对象稳定的认知。因此,大模型的表征收敛不仅为人工智能技术发展提供了新的便利,还表明认知本身具有相对稳定的一般结构。大模型基于大数据训练而成是不争的事实,然而,大数据之“大”并非复刻整全存在的任意大,这既缘于技术本身的限制,也是大数据客观存在的特质。因此,经由数据挖掘而获得的收敛性并非是数据自身具有的客观结构,而是大模型形成的内部表征。大模型以此为逻辑的表征收敛,使基于数据的知识描述物理实体具有稳定性、客观性和可行性。虽然这不是传统逻辑的一致性、不矛盾性和齐一性,但是其行为主义的有效性却充分证明了挖掘即认知的重要观念。 表征收敛是大模型表达数据特性的功能特性。当然,大模型的表征收敛不是直接把数据具有的收敛性复制进系统,而是进入数据生成的结果之中才获得对数据存在逻辑的认知。我们知道,“在解释装置如何工作时并不需要表征概念;只有在解释装置怎样完成设计者预定的功能时才需要表征概念”[10]。表征收敛表面上看是系统的功能性特质,但是却从根本上体现出大模型挖掘大数据的初衷和基本假设。大模型参考柏拉图的“洞穴隐喻”,认为表征收敛的终点与核心原则是“不同的模型都只是从不同维度对现实的一种描述”[11]。当然,大模型的描述本身就是一种判断,不同大模型基于不同维度处理了大数据本身。然而,“所有数据都是由人类生成的”,“数据是由社会构建的”。[12]无论是数据表达,还是从数据中获得的规律,都不再是被“洞穴”之外的普照光投射到影壁上的描述。人类生成数据、社会建构数据“并不是随心所欲地创造,并不是在他们自己选定的条件下创造,而是在直接碰到的、既定的、从过去承继下来的条件下创造”[13]出来的数据。因此,数据作为抽象的对象,并不能构成大模型的因果性输入,而只能是被重新还原的“洞穴上的阴影”[14]。虽然大模型在数据训练的直接性上面对的是封闭系统内的特质问题,但是却不必依赖于布伦塔诺的“心理现象不是由物理规律而是由心理规律本身决定”[15]的假设,就可以在模型表征中对齐数据并获得有效预测。究其原因,无论是历史唯物主义所保障的人类社会行为的稳定性中内蕴的数据收敛性,还是普特南“收敛现实主义”的哲学确认,都指向数据存在的对齐本性。当然,大模型并没有把数据作为物理主义的假设,而是“使用编程语言描述的数学定义以及关于其数据结构的公理”[16]来证明数据刻画事实的有效性,也就必然会表达为表征的收敛性。 大模型的表征收敛不仅事实性地证明了数据表征存在的稳定性与客观性,而且表明大模型挖掘的认识活动具有收敛性。大模型挖掘即认知的“创构认识论”[17]范式成功搭建了“‘安娜·卡列尼亚’场景”[18]。一方面,不同结构良好的大模型并不会影响数据表达的存在,因为不同大模型都是以同样的机制表达着世界的可能性。今天的大模型不仅都是以具有反向传递性的神经网络作为物理结构,而且都是以深度学习作为认知逻辑。因此,大模型的不同模型不过是“条条大路通罗马”的“条条大路”,都只是把“内部结构插入其中”而已。[19]另一方面,大模型之大本身就蕴涵着“越多越好”[20]的原则,越多的数据、参数和训练交织形成复杂性越能保证表征的收敛性。虽然量大首先是基于技术设计的考量和表征逼近的方便,但其本身既意味着数据刻画对象维度的复杂和视角的全面,又说明了动态修正和不断优化才是保证对齐和收敛的根本方式。由此看来,大模型的表征收敛坚持了唯物主义对象稳定性的原则,却又不是从规定原则来分析对象的客观性。因此,一方面,数据这种基于信息的存在,作为大模型挖掘的对象向大模型本身敞开其内在的结构,另一方面,大模型也建构了大数据表达自身的结构。由此可见,大模型的表征收敛是大数据与大模型双向奔赴的结果。大模型的大参数和大训练显然不是对大数据同一维度的重复加总,也并非是在追求绝对全面中呈现大数据刻画对象不可见的一面,而是坚持特征向量具有的鲁棒性。或者说,大参数和大训练本身接受了康托集和哥德尔不完全定理的哲学训诫,以挖掘认知的稳定性而不是“实在的自洽观念”[21]来保障表征的收敛性。由此带来的深层哲学意涵则是,“大”所支撑的表征收敛本身体现了创构数据的人类实践的稳定性,大参数与大训练则构成了稳定性的另一重隐喻。即在认知中,客观实在、对象的自洽等并非是认知成果一致性的必要条件,经由人创构的机制本身也可以保住表征的收敛性,并“标志着我们已然触到了实在界/真实(the real)”[22]。