数字人文的理论沿革和范式转向:从“人文研究的数字方法”到“后数字时代的人文研究”

作  者:

作者简介:
夏翠娟(通讯作者),ORCID:0000-0002-1859-6979,中国人民大学信息资源管理学院博士研究生,上海图书馆研究员,E-mail:cjxia@libnet.sh.cn(上海 200031)。

原文出处:
中国图书馆学报

内容提要:

对数字人文和包括语言学、文学、历史学、艺术学等在内的传统人文学科来说,元宇宙和新一代AI技术正在成为库恩所谓“范式革命”的潜在驱动力。本文通过对国内外数字人文发展脉络的梳理,基于范式转向的视角分别提出国内外数字人文发展的分期,并从人文研究的数字方法、方法论的形成和嬗变两个层面分析了国外数字人文发展的理论沿革及从人文计算向数字人文的话语转变和范式转向的生发机理,以考察中国数字人文从传统人文到人文计算、从人文计算到数字人文、从数据驱动到AI驱动的范式转向情况,试图回答以元宇宙和生成式人工智能(GenAI)技术的广泛应用为标识的后数字时代需要怎样的人文研究,并初步规划出后数字时代数字人文的领域蓝图和研究框架。研究得出如下结论:一是国外数字人文范式转向的本质和共性表现在人文研究的数字方法从以数据建模为主转向以界面批判为主,方法论从以计算思维为主转向计算思维和批判思维同时运用且以批判思维为主;二是中国数字人文并未完全完成人文计算向数字人文的转向,大量实践工作仍然围绕数据建模,方法论仍以计算思维为主、批判思维运用不够;三是GenAI可能引发的科学研究范式革命有望解决以数据驱动的第四范式为主导的数字人文领域现存的困境,但还需满足一定的条件;四是后数字时代的数字人文研究应重视批判思维的运用,将技术产生的新的人文问题纳入研究范畴,重新认识人文与技术的关系,将技术不仅作为方法还要作为研究对象。


期刊代号:G9
分类名称:图书馆学情报学
复印期号:2025 年 01 期

字号:

  0 引言

  回顾人类科技发展史,不难发现,每一次重大科技革命的发生,必然会引起社会生产力的变革,进而影响人们社会生活方式、思想观念和思维模式的革新。数字人文(Digital Humanities)作为一个跨学科领域,正是语言学、历史学、文学、艺术、哲学等传统人文社会学科,受信息资源管理学科中数字文献、信息分析等理论和方法的影响,在计算机技术、互联网技术、大数据技术、人工智能技术等信息科技的催生、促进和推动下,交叉融合而形成的,并且随着技术的发展和进步,其理论、范式和方法也不断变化。2022年11月,OpenAI在互联网上公开发布一款名为ChatGPT的人机对话工具,展示了以大语言模型(LLM)为代表的生成式人工智能(GenAI)技术在理解和生成人类语言方面的惊人能力,在全世界范围内引发了广泛的关注和讨论,一场可媲美蒸汽机发明的新科技革命正在到来。一年多来,以OpenAI的ChatGPT、DALL·E 2、Sora等划时代的产品为代表的GenAI技术以日新月异之势飞速发展,无论处于何种行业、从事何种工作,人们已无法否认,这场科技革命必将引发全方位的重大变革。在科研领域,对数字人文和包括语言学、文学、历史学、艺术学等在内的传统人文学科来说,新一代人工智能技术正在成为库恩所谓“范式革命”的潜在驱动力。

  作为人文计算和数字人文发展史上的知名学者,梅丽莎·特拉斯(Melisa Terras)在“2010年数字人文大会”的闭幕式演讲中为数字人文领域的身份认同、影响力和可持续性发展提出了一个议程,核心是发展领域的定义、清晰表述领域的相关性、成就、影响,以及该领域作为一门学科的由来,从而保存学科传统[1]。“领域的历史和定义是领域自我意识和自我表现的关键所在”[2]160。在GenAI技术迅猛发展的当下,中国需要探索巩固并发展专属于数字人文学科的核心问题研究域和理论范式体系,形成融合多个传统人文学科的学术共同体,推动数字人文的学科化建设。因此,有必要回到数字人文诞生的原点,追问“从何而来、何以至此、未来何往”等根本性问题。本文采用系统性文献综述的方法,通过分析国内外数字人文领域的经典文献,包括2000年至今出版的10余种专著和2007-2023年《数字人文季刊》中发表的重要文章,对数字人文的概念、理论、范式,跨学科的方法论共同体(Methodological Commons),不同人文学科开展数字人文研究的方法与技术,数字人文共同体的形成和学科建构,以及当下数字人文面临的挑战和可能的未来,进行全面的总结、分析和提炼,从而为考察中国数字人文的发展现状、存在的不足、是否完成了从人文计算向数字人文的范式转向、是否能实现数据驱动向AI驱动的范式转向等问题提供参考框架。

  1 国外数字人文发展历史回顾:从人文计算到数字人文

  在梳理数字人文发展历史时,学者往往基于一定特点进行历史分期,这样的方法有助于更好地理解过去、观照现在、展望未来。关于数字人文的发展史,较有影响的分期方法一般有两段论和三段论。两段论观点见于2009年发布的《数字人文宣言2.0》。在该宣言中,以2000年为界,以定量研究和定性研究为特点进行分期。两段论认为数字人文的第一次浪潮(2000年以前)是定量的,它调动了数据库的查询和检索能力,促进了语料库语言学的自动化,将超级卡片堆叠为关键字数列;第二次浪潮(2000年以后)是定性的、解释性的、经验性的、情绪化的、生成性的,它将数据和工具用于人文学科的核心方法论,关注复杂性、媒介特异性、历史背景性、分析深度性、批判性和阐释性。持三段论的学者以大卫·贝里(David M.Berry)为代表,他认为数字人文的第一次浪潮(20世纪40年代—2001年)是人文计算(Computing in the Humanities)阶段,关注数据库和计算工具的构建;第二次浪潮(2002-2009年)是数字人文(Digital Humanities,DH)阶段,关注人机交互界面和原生数字化的内容;第三次浪潮(2009年至今)是“复数”的数字人文(digital humanities,dh)阶段,作为一个集合概念,强调跨学科性和多方参与,关注媒介和文化批判[3]。为了更好地考察范式转向的生发机理,笔者将国外数字人文的发展分为三个时期:人文计算时期(20世纪40年代-2000年)、范式转向时期(2000-2009年)和数字人文时期(2009年至今),重点分析范式转向前后数字人文概念、理论、方法论的重要特点,以及变化是如何发生的,外部环境是如何影响内在动机、内在动机又是如何影响变革方向的。

  1.1 人文计算时期(20世纪40年代—2000年)

  在20世纪的后50多年中,表征现在人们所熟知的“人文计算”(Humanities Computing)概念的词语有不同的表达,并且经历了多次的反复。“Humanities Computing”一词最早出现在Computers and the Humanities1966年第2期的一篇文章中,在1968年发表的《意大利的人文计算活动》一文中被认为“家喻户晓”,却依然没有占据主导地位,其后经过多次反复,直到两册《人文计算年鉴》(1988年、1991年)和五册《人文计算研究》(1991-1996年)的出版,最终确立了这一名称之于计算机与人文研究交叉领域的主导地位。“人文计算”名称的确立历程反映了学者是如何命名计算机与人文研究所形成的交叉领域的。从“Computers for the Humanities”到“Computers and the Humanities”再到“Computers in Humanistic Research”,直至最终融为一体,不再需要任何介词作为连接,反映了随着计算机科学技术的发展,人文学者对于计算机、计算方法和技术与人文研究之间关系的认识的变化。从开始作为工具的“计算机”(computers),到后来作为方法的“计算”(computing),从作为机器的“他者”变成学者在研究过程中主动使用和创新的研究方法,从而成为与研究主体密不可分的一部分。而这种看法的改变,也对“人文计算”发展成为一种跨学科的方法论基础,起到了关键性的作用。

相关文章: