算法阐释:人工智能时代的文论问题

作 者:
曾军 

作者简介:
曾军,上海大学文学院(上海 200444)。

原文出处:
华中师范大学学报:人文社会科学版

内容提要:

以ChatGPT和“文心一言”为代表的大语言模型展现了“AI生成”的巨大潜力。通过算法进行运算是计算机编程语言与人类自然语言的根本差异,这也是理解人工智能的重要维度。把算法引入文学研究,一方面需要理解算法背后的逻辑,另一方面还要理解文学研究自身不断“数”化的进程。文学研究对与算法相关议题的关注由来已久。20世纪80年代的“方法论热”不仅将与人工智能相关的控制论、信息论等作为重要的科学基础和思想来源,而且开始尽可能调用已有的文学和艺术资源,试图实现对“三论”中的观点和方法的文学化和美学化征用,这构成把算法引入文学研究的理论“先声”。研究算法阐释有两种路径。其一是将算法作为对象,通过辨析算法的运行逻辑及执行过程来与文学创作和文学研究的活动相比较,进而讨论以作为对象的算法阐释有何特点。基于20世纪以来西方文论相关理论思维,可以将算法作为对象的阐释命名为“人—机互动”的“可写阐释”。其二是将算法作为方法,通过对算法的数据处理能力的应用及其任务实现效能的评估,为文学研究这一此前纯粹属于精神生产领域的活动赋能,进而提高文学研究的效能。“数字人文”(“人文计算”)便是对这一辅助性方法的命名,且已经经历了近90年的发展。进入人工智能时代之后,文学研究有可能实现对文学意义的“总体阐释”。


期刊代号:J1
分类名称:文艺理论
复印期号:2024 年 03 期

字号:

      DOI:10.19992/j.cnki.1000-2456.2023.05.010

      近年来,以ChatGPT和“文心一言”为代表的大语言模型先后横空出世。它们因具有了通用人工智能的某些潜能,而令几乎所有人文社会科学及自然科学研究者感到前所未有的冲击。其实ChatGPT和“文心一言”只是全世界数以百计的各类大模型中的一种。根据《中国人工智能大模型地图研究报告》显示,仅2021-2023年短短两年间,中国就自主研发了79个大模型,不仅有大语言模型,还有视频大模型、多模态大模型等①。它们都聚焦“AI生成”领域,提供文本生成、图像生成、声音生成、代码生成,以及多模态之间的相互生成的解决方案。语言是人类思维的工具,经由“AI生成”的文本、图像、声音和程序直接“入侵”了人类精神活动最核心的领域,并开始表现出知识生产、艺术创新和思想重构的巨大潜能。

      “AI生成”技术的出现带给人类的震惊及对未来的恐惧令每个人文学者被迫思考一个重要的问题:我们是否会被替代?在科技与人文的交锋中,人文学者一直处于弱势的、被动的、防御的地位。然而,作为正在进入人工智能时代的人文学者而言,简单的拒斥和回避是无济于事的。我们只有了解“AI生成”的技术与人类此前从事精神活动和艺术创作的手段之间的异同,才有可能较为深入地讨论“AI生成”给人文研究带来的影响。因此,将算法引入文学研究,实质上是对“AI挑战”的一种回应:人工智能时代文学研究将呈现怎样的新面貌?由此会发生怎样的研究范式转换?

      一、未来已来:算法逻辑及其被理论化的可能

      将算法引入文学研究,一方面需要理解算法背后的逻辑,另一方面还要理解文学研究自身不断“数”化的进程。只有这样,才能实现算法的理论化。

      计算机编程语言和人类自然语言的区别,根本在于算法。所谓“算法”,指的是一系列解决问题的步骤和指令集。它是一种能够被计算机程序所实现的、有明确规定性的计算过程。算法包含着一系列环环相扣的步骤,每个步骤又包含若干指令来规定着其任务的执行方向。根据最新统计,全世界的自然语言有7000多种,那么编程语言有多少种?目前为止还没有标准答案,但根据估算可能存在几百种编程语言②。将人所使用的自然语言与在计算机中运行的编程语言进行对比,可以发现,编程语言中没有语音学、语言习得相关问题;与自然语言中存在语言的变异与演化类似,编程语言也有语言历史学、语义学、语法学、语言类型学、语言标准化相关的问题。唯一一个在自然语言中不存在,而在编程语言中存在的,就是算法。所以算法事实上是理解编程语言的过程中最重要、最特殊的内核。

      从计算机到人工智能,算法经历了从“计算机辅助算法”到“AI辅助算法”的演变。所谓“计算机辅助算法”是非人工智能的,这其中人是算法的设计主体、任务主体,计算机则是算法的执行主体,二者间界限分明。“AI辅助算法”则与此不同,计算机不仅是执行主体,而且拥有了自我学习能力,进而拥有替代部分人的设计能力和任务能力,具有自主执行能力。ChatGPT的使用证明,人工智能的算法能够处理不确定性的信息,它具有数据驱动的模型,因而具有很强的适应性和自适应的能力。这里还存在人工智能专家也无法完全理解的算法黑箱问题。也就是说,人们并不太清楚算法到底是怎么实现既定的任务和目标的。最新的研究显示,OpenAI的设计师正在用GPT4去理解GPT3.5的运行,希望通过高级人工智能去理解低级人工智能,以破解黑箱的奥秘。

      要理解算法背后的逻辑需要从算法的技术原理和一般规律的角度出发。首先,算法种类多样,所有的算法都是为了实现特定目的而被制造的。如为了解决排序问题而设计的快速排序算法,为了解决最短路径的问题而设计的Dijkstra最短路径算法,为了挖掘关联规则而设计的Apriori算法等。其次,每一个有特定目的的算法都有特定的数据结构。如快速排序算法的数据结构是数组,Dijkstra最短路径算法的数据结构是加权有向图,Apriori算法的数据结构是事务数据集合等。最后,每个算法的执行过程也不一样。比如快速排序算法的执行过程就是先选取一个基准元素,进而将序列中小于基准元素的放左边、大于等于的放右边,最后再用递归处理两边的序列。Dijkstra最短路径算法的执行过程是首先将所有节点之间的距离初始化为无穷大,将起点的距离设为0并加入访问集合,进而更新起点与不同节点之间的距离并将其加入访问集合,最后通过不断重复上述过程,直到所有的目标节点加入访问集合或者待访问集合为空。因此,根据任务的不同,便会设计出不同的算法,如排序算法、搜索算法、图形算法、计算几何算法、加密算法、优化算法、机器学习算法、深度学习模型、神经网络、梯度下降算法等。简言之,算法首先要去理解其目的是什么,即要解决什么问题;然后理解数据结构、运行规则、执行过程分别是什么;最后还要问的是,这一算法是否有效。

      怎样把算法引入文学研究?这需要实现自然语言的文学和编程语言的算法的“双向奔赴”。事实上,文学研究也经历了不断地被“数”化的历程。

      第一阶段是指“数学化”,即用数学中的计算方式来理解文学。在《中国叙事学》一书中,浦安迪发现中国古代的四大奇书里有一个非常有趣的奇书文体的结构现象。他概括为“十回”的主结构,即百回的小说都是以每十回为一个单元,从而构成了十乘以十的叙述节奏。“十回”的主结构里又存在“三、四回”的次结构,也就是说“三三四”“三四三”或“四三三”的结构模式③。这就是浦安迪从数学角度对四大名著早期版本所做的研究。从这里可以看出,数学化过程有助于以一种抽象化的方式来理解文学文本的特有规律。

相关文章: