语料库驱动词典学、语料库词典学与语料库辅助词典学  

作 者:

作者简介:
Sven Tarp,奥胡斯大学词典学研究中心(丹麦 8000)。

原文出处:
辞书研究

内容提要:

近年来,随着语料库在各项语言研究及词典编纂实践中的广泛运用,出现了“语料库驱动词典学”或者“基于语料库的词典学”的说法。文章论述了语料库与词典编纂的辩证关系,讨论了语料库在注释专科术语词条时的局限性,认为“语料库辅助词典学”的说法较为准确地描述了语料库与词典学的关系。


期刊代号:H1
分类名称:语言文字学
复印期号:2016 年 11 期

关 键 词:

字号:

      半个世纪之前,第一个电子语料库付诸使用,语言学界与词典学界的争论也随之而来。有的学者很快接受了这种便利的新资源,但也有相当一部分学者对这种新资源持怀疑态度。Lees(1962:100)认为语料库分析“纯粹是浪费时间、耗费政府钱财”,而Itkonen(1976:65)也称此为“多此一举”。Lees(1962:110)称:“英语本族语者在十分钟之内说出的语法点要比几百万字的随机文本多得多。”

      许多早期从事语料库理论和实践研究的学者,例如Francis(1979)反驳了Lees和Itkonen的保守观点。时至今日,语料库已经广泛地用于各类语言学研究和词典编纂。词典学家们能够从大型语料库中更迅速、便捷地获取和挑选数据。与之前的方法相比,语料库提高了词典学家们的工作效率,也有助于提高词典的质量。这和Lees在半个世纪前对语料库的看法截然不同。许多学者,例如Sinclair(1987),Atkins & Rundell(2008:45-96),Hanks(2012a,b)和Bergenholtz & Agerbo(2014)都展示了如何利用语料库编纂词典。他们所提出的利用语料库编纂词典的许多方法都受到了批评。这些批评对于一个不断发展的学科来说很正常,更无法否认语料库对词典学研究和实践的价值。

      不过,所谓的“词典学界掀起了语料库革命”(Hanks 2012a)的说法有些言过其实,甚至会阻碍某些词典编纂活动。Lees和Itkonen的说法尽管武断,但至少就专科词典学而言还是有几分道理的。在专科词典学领域,需要考虑利用语料库编纂专科词典的局限性,而不是直接否认语料库的作用。随着新科技或者新范式的出现和发展,许多研究者经常会否定之前的研究方法,即使他们曾从中获益良多。他们往往会盲目相信新科技的神奇和便利,无法即时预见新范式的局限性。往往经过一段时期之后,大家才意识到这些局限性,而此时这些新范式已经根深蒂固。

      二、语料库与词典学

      运用新科技建构语料库并从中获取数据编纂词典时,大量的新术语由此而生。要充分描述新的社会现实,这些新术语绝对必要。然而,有些术语却问题蔓生,根本无法如实描述学科研究现状。或许在引进这些新词之前学者并未认真探索其真实含义,例如“语料库词典学”“语料库驱动词典学”和“基于语料库的词典学”等词语。

      词典学实践所涉及的远不止是实证基础(Tarp 2014a)。从这一角度而言,语料库并不是词典学的另一种表现形式,而是完成词典编纂过程中的某一任务的方法之一。因此,Bergenholtz(1996)指出,不论语料库在词典编纂过程中完成的任务多么重要,用“语料库词典学”一词描述整个词典编纂方式是不恰当的,因为语料库不过是用于编纂词典的若干实证资料的一种而已。例如,我们编纂词典时也会用到档案、问卷、日志文件,但是没有“档案词典学”“问卷词典学”“日志文件词典学”之类的说法。

      Krishnamurty(2008)指出,“语料库驱动词典学”的说法可以追溯到John Sinclair。“语料库驱动的方法自上而下,先从语料库中挑出未编辑的实例,确认这些例子的共同特点和各自特点,然后按照词典的编纂目的将它们分类、组合。”(Krishnamurty 2008:231)这段引文中的观点极有参考价值和科学性。然而,“驱动”一词使用不够恰当,因为语料库是一个被动的实体,无法驱动或者决定词典中应该包括什么。例如,描写性词典、规定性词典、建议性词典(指的是遵循建议原则而编纂的词典,参见Tarp & Gouws 2008)挑选数据和呈现信息的方法就各不相同。

      语料库为词典编纂提供语言证据,但是词典编纂也讲求系统原则。例如,用以挑选《马达加斯加语—德语词典》(Bergenholtz et al.1991)词目的语料库中,词语talàta(星期二)出现的次数极少,未达到词典收录的词频标准,但是出于系统性原则考虑,该词必须和其他表示星期的词语一起收入词典。因此,“语料库驱动”的说法低估了词典学家在词典编纂过程中的积极角色。“基于语料库的词典学”的说法也有问题。现代化的数字词典的编纂在许多环节中需要语料库辅助完成,但是也有许多环节和语料库毫无关系。显然,“基于语料库的词典学”的说法过于笼统,有待商榷。

      电子语料库对于挑选或者佐证诸如词目、等价词、搭配、成语、惯用法等的实例、释义或者特点之类的词典编纂活动非常有用,但是无法解决所有问题。以上所讨论的三个术语反映了当前词典学研究中表述混乱的现状。但这些术语已深植于词典学界观念之中,不太可能废弃。尽管如此,本文建议使用更为精准的术语确切地描述词典编纂与语料库之间的关系。例如,“语料库辅助挑选”和“语料库辅助佐证”的说法要好于“基于语料库的挑选”或者“基于语料库的佐证”,因为除了语料库以外,词典词目的挑选和佐证也来自其他实证基础。

      三、学科专家与专科词典的编纂

      专科词典的编纂传统悠久而丰富,但许多普通词典学的研究者常常忽略这一点。Hoare(2009)指出,英国皇家图书馆里的大部分词典都是专科词典。其他研究的调查结果也是如此,例如,Leroyer(2011)对2008-2009年的网络版词典标题的调查研究也得出相同的结论。迄今为止,已经编纂的专科词典几乎覆盖了所有的学科和人类的文化活动,正如Tarp(2014b:214)所言:“词典尤其反映了过去四千年的社会、历史文化变迁,无论是从语言发展的角度,还是从手工业、经济生活、文化、教育、自然社会科学、人文、体育,甚至诸如消遣、娱乐、节假日之类的种种奇异现象的角度。”

相关文章: