1.0 引言 “语料库语言学已经成为语言研究的主流。基于语料库的研究不再是计算机专家的独有领域,它正在对语言研究的许多领域产生愈来愈大的影响。”这是J.Thomas等人1996年为祝贺语料库语言学的主要奠基人和倡导者G.Leech六十诞辰而出的语料库语言学研究论集的开场白。 近年来,对语料库语言学类似的评说频频见于导论和方法论的书及教科书中,它不仅仅是语料库语言学家们的自誉,而正在成为整个语言学界的共识。 2.0 语料库语言学的定义 关于语料库语言学的定义,现引述三例: a.“根据篇章材料对语言的研究称为语料库语言学。”(K.Aijmer & B.Aitenberg,1991,p.1) b.“基于现实生活中语言运用的实例进行的语言研究称为语料库语言学。”(T.McEnery & A.Wilson,1996,p.1) c.“以语料为语言描写的起点或以语料为验证有关语言的假说的方法称为语料库语言学。”(D.Crystal,1991,p.86) 由上述几个定义可见,语料库语言学不是研究语言自身某个方面,而是一种以语料库为基础的语言研究方法。它实际上包括两个方面:一是对自然语料进行标注,二是对已经标注的语料的研究和利用的方法。从方法论的角度,它不仅可以用于研究语言系统的各个层面,而且可以应用于语言学之外的其他领域。 3.0 语料库语言学的历史发展 语料库语言学作为一种研究语言的方法,可以追溯到上个世纪,甚至更为久远。现在一般以乔姆斯基转换生成语法的兴衰时间为参照,将其发展大致分为以下几个阶段: 3.1 语料库语言学的早期发展 早期的语料库语言学指的是本世纪五十年代中期以前,即乔姆斯基提出转换生成语法理论之前的所有基于语言材料的语言研究。此类研究主要集中在以下几个方面: (1)语言习得是应用语料研究方法较早且较普遍的领域。19 世纪70年代在欧洲兴起了儿童语言习得研究的第一个热潮,当时的许多研究就是基于父母详细记载其子女话语发展的大量日记的。据悉,这些日记作为原始材料,不仅是当时W.Preyer和W.Stern 等人的理论假说的依据,而且时至今日仍是许多学者的研究语料之一。自本世纪30年代以来,语言学家和心理语言学家提出了众多关于儿童在不同年龄段的语言发展模式。这些模式大都是建立在对儿童自然话语大量材料的研究分析上的。 (2)利用自然语料开展音系研究, 在西方当首推美国早期的结构主义语言学家,如F.Boas和E.Sapir等人。他们注重“野外工作”, 强调语料获取的自然性和语料分析的客观性。这些都为后来的语料语言学所继承和发展。 (3)方言学从其产生以来就与语料结下不解之缘。在西方, 方言学脱胎于19世纪的历史比较语言学,最初兴趣主要是研究运用直接法所获取的有关单音不同分布的事实来绘制方言地图。“方言研究者手持笔记本,后来是手提录音机,记下或录下他所遇到的一切方言材料。此种取样法至今仍为某些业余研究者所用,它对于研究方言词汇的分布有一定价值。”(Francis,1983:49—50)在我国, 运用语料的方法远至周秦。据应劭《风俗通义序》“周、秦常以岁八月遣輶轩之使,求异代方言”。我国汉语方言学第一部著作《方言》就是这种方法的产物。据载,扬雄非常喜爱方言,他利用考廉(略等于后代的举人)和士兵们集中在首都的方便,普遍地进行走访,不断积累材料,坚持编纂整理,经过27年的艰苦努力,终成《輶轩使者绝代语释别国方言》。 3.2 新的语料库语言学 1959 年, R.Quirk 着手建立“英语用法”语库( Survey ofEnglish Usage)。该项目旨在收集大量的风格题材各异的语料作为对英国英语口语和书面语进行系统描写的基础。 几乎与此同时, 以 N.Francis 和 H.Kucera 为首的一批语言学家和计算机专家汇集在美国的布朗大学合力攻关,并于1961年建成了当今最早的机读语料库——布朗语库(Brown Corpus)。这两个库可以说是现代语料库语言学的开端。 3.3 语料库语言学与乔姆斯基转换生成语法 50年代中前期,在实证主义和行为主义思潮的影响下,语言研究总体上是经验主义占主导,这种氛围无疑促进了对语料的重视,使其成为当时的热点之一。特别在美国,以Z.HaRRis等人为代表的后布龙菲尔德结构主义语言学家视语料为语言学的唯一研究对象。在他们看来,直觉证据是第二位的,是靠不住的,应该放弃。但是这种状况随着乔姆斯基1957年《句法理论》及其以后的一系列论著的发表被根本转变。笛卡尔主义的理性主义占据主导地位,经验主义几乎无立足之地,被视为经验主义产物的语料研究自然被完全否定。乔姆斯基及其转换生成语法学派否定早期语料研究主要有两点: (1)语料研究的方向有误。乔姆斯基认为, 语言研究的主要目标是建立一种能反映说话人心理现实的语言认知模式,简言之,语言能力模式。因为只有语言能力才能对说话人的语言知识作出解释和描述,而语言运用只是语言能力的外在证据,它往往会因超语言因素的影响而发生变化,因此,它不能确切地反映语言能力。语料从本质上只是外在化的话语的汇集,基于语料的研究所建立的经验模式充其量只能对语言能力作出部分解释,因而语料不是语言学家从事语言研究的得力工具。