对传统人文研究来说,泡在纸质版文献里埋头苦读是必不可少的常态。随着科技的快速发展,数字人文(digital humanities)应运而生,其最大特点是一切文本(文字、图像、声响、影像及其综合性文本)均可被数字化,在计算机和互联网的帮助下,被数字化了的文本互联互通,构成庞杂而又可从不同维度被有序化的数据库,研究者可以利用大数据平台处理文本资料。从故纸堆到数据,从阅读欣赏到机器读数,面对文献平台和阅读方式的改变,文学批评做出了及时反应,从一新一旧两个范畴中可见一斑:莫雷蒂(Franco Moretti)的远读(distant reading)和乔克斯(Matthew L.Jockers)的常量分析(macroanalysis)。以莫雷蒂和乔克斯为核心成员的斯坦福文学实验室(the Stanford Literary Lab)把自己的新方法归结为量化形式主义(quantitative formalism),这使得远读与常量分析成为其颇具个性化色彩的表述。这种利用计算机大数据处理技术建立起来的多学科交叉研究模式,一方面展现出北美学者开风气之先的创新意识及其背后独特学术体制的支撑,在当代人文学者探寻符合时代要求的新视野中无疑走在了最前沿;另一方面,新范式难免有不足,如结论表现出平庸倾向,文学内外部研究结合得相当机械,如果过度依赖工具理性达成非人文之目的,就会使数字人文脱离人文科学的轨道。 一、从远读到量化形式主义 信息技术的迅猛发展和认知科学有关阅读体验的新见解,给传统文学研究带来了前所未有的挑战。意大利裔美国学者莫雷蒂试图直面这种挑战,于2000年发表论文《关于世界文学的一些猜想》,重议发端于歌德的世界文学范畴,因为它“尚无真正的理论”,“我们没有一整套概念,也没有各种假设来组织构成世界文学的大量数据。我们不知道什么是世界文学”。①世界文学作为一个体系性整体,由内部彼此不平等、又相互关联的各种文学构成。莫雷蒂借用科恩(Margaret Cohen)的“未被阅读的伟大作品”(the Great Unread)②,说明在“被遗忘的99.5%的文学”中有许多不同类型的作品,人们讨论的只是整个世界文学体系这棵树上的“一些同时共存的枝杈”,而“树有用,因为这是能够‘窥探’一种较大文学史的一条很好的路径”。③怎么描绘这棵枝叶繁茂的大树?莫雷蒂引用年鉴学派创始人布洛赫(Marc Bloch)的名言“经年分析就为一朝综合”④,以该派第二代领军者布罗代尔(Fernand Braudel)及其高足沃勒斯坦(Immanuel Wallerstein)将世界视为体系的研究为例,阐明把别人著作综合成半页、三分之一页或四分之一页纸而形成自己理论的可能性。在全球化浪潮中,史学确实面临诸多挑战,选择时间、地点和论题的新视野致使视史学为史料学的传统史观发生了根本性的改变,“无法各个议题事必躬亲、面面俱到;全盘进行‘原始资料’的梳理几乎不可能,所以‘综合’必然多于‘分析’,取资间接史料或旁人研究遂不可避免”⑤。史观的丕变直接催生了远读理论,而且莫雷蒂在此变之路上走得更远,“文学史……将变成是‘二手的’,即由其他人的研究拼凑而成,无须孤坐冷板凳去直接阅读文本”⑥,其合乎逻辑的必然结果就是对传统细读(close reading)发起冲击。他认为,细读以及从新批评到解构主义的一切理论都依靠极为狭窄的经典,这一无意识的或看不见的前提导致研究者只有在认定少量个别文本很重要时才会对其投入巨大精力,因此阅读成了“一种神学训练”,先要严肃地选定极少量的经典文本,而后再庄严地对待这些文本,莫雷蒂想做的就是“与魔鬼签下一纸小契约:我们知道怎么读文本,现在就让我们学习不要这样读它们”⑦。在颠覆传统文学批评方法的同时,莫雷蒂致力于系统地构建自己的新范式: distant reading(远读):这里的distance(距离),让我重复一遍,是一种认知状态,它允许你去专注比文本小得多或大得多的各个部分:手法、主题、辞格或各种体裁与各种体系。而在很小和很大之间,如果文本本身消失,那么这是其中的一种可正当地称为“少即多”的情形。如果我们想了解其整个体系,我们必须接受会失去一些东西。我们总是为理论知识付出代价:现实是无限丰富的;各种概念是抽象、贫乏的。但正是这种“贫乏”才使我们有可能去把握它们,从而有可能去认识它们。这就是少即多的原因。⑧ 就莫雷蒂的想法而言,远读与细读相对峙,其字面意思当为远距离阅读、从远处阅读(试比较:近距离阅读、从近处阅读),即站在整个世界文学体系这棵大树的高度,宏观考察各种“枝杈”的特点及其演变规律。它与细读一样具有隐喻色彩,含义缺乏自然科学般的明晰性,可以将之理解为随便阅读、快速阅读、粗略阅读、连续阅读、广泛阅读、宏观阅读等,甚至于非人工阅读、电脑扫读、遥测读数等。不管如何理解,其要义之一在于首创者试图表现出弥补传统细读之不足的努力,如局限于狭窄的经典文库,依附于孤立和封闭的经典文本。不满足于传统文学批评的“认知状态”,直接促使莫雷蒂重新审视世界文学发展的特点与规律,其内在逻辑可概括如下:文学本身的无限丰富与研究者所读经典的狭窄范围之间形成了巨大的空间,可以在这个空间里大有作为,认识小到小于具体经典文本的文学形式要素和大到大于该经典文本的整个文学创作体系,关键是要掌握理论思维,通过手法、主题、辞格和体裁、风格等艺术要素,建立表面上颇为“贫乏”“抽象”的理论认知模式,这些要素都是某一文本的一部分,因此比这一文本小,同时又比这个文本大,因为它们是对尽可能多的文本的抽象概括,具有普遍意义。远读是理论思维的展示,认识这些既小又大、既少又多的形式要素的特点,尤其是它们不断演进的规律,正是它所追求的目标。 在莫雷蒂的直接影响下,2010年斯坦福大学成立了文学实验室,出版“斯坦福文学实验室小册子”,其第1期,相当于成立宣言,被取名为“量化形式主义:一种实验”⑨,醒目地宣示了他们的理论核心——量化形式主义方法论。它被通俗地称为“计算批评”:“数字时代研究文学史和文化史的一种方法,是科学方法、解读方法、实证方法、理性主义方法等各种研究方法的一种形式”⑩。与传统的形式主义量化分析有所不同,实验室成员们在分析和统计文学形式要素时必须借助数字化文本和计算机大数据处理技术。作为数据的海量文本或具体文本的海量细节均可按照研究者的兴趣和需要,转化为各种可视化表格、地图、树形图、网络图等,特别是转化为各种量化模型或数学建模。《量化形式主义:一种实验》的5位作者分别详细介绍了这种方法的缘起和形成过程,或者说建立文学实验室的来龙去脉。