0.概述 西方的英语翻译语料库(Translational English Corpus,以下简称TEC)实际上是在语料库 语言学理论的基础上产生出来的一项用于翻译理论研究的实用方法。英语翻译语料库大都是 把译成英语的各种真实的正式出版物汇集起来,对语言现象用计算机进行统计、比较和分析 。语料库取材于广泛的职业翻译作品,因此,这一资源为探讨翻译文本的性质、译者的个人 风格、源语对目的语(英语)句型的影响、源语对文本类型的影响,以及其他一些翻译学者和 语言学家感兴趣的问题提供了广泛的研究空间。更重要的是,作为一种具体而又详细的资源 ,它还可以为研究者验证理论上的翻译性质是否有效、实践中的翻译方法是否可行。本文的 阐述旨在说明语料库作为一种研究方法已经广泛地应用在西方翻译领域内,并取得了一定的 成 果,这是值得我们注意的。 1.TEC的理论基础及其产生背景 翻译语料库的产生应当说是从语言学翻译理论发展而来的。众所周知,早在20世纪30年代 ,语言学已经形成了系统化研究。人们期待必要的理论工具来解决实际遇到的问题。正如语 言学家乔姆斯基所说的那样“必须迈出一大步,即,从直觉到科学,要把译者在实践基础上 总结的个人思想归结到系统的科学上来。”(Klaudy 1991:92) 到50年代和60年代中期,翻译研究在西方呈现出一个高潮。首先是俄国语言学家A.Fjodoro v在他出版的《翻译理论导言》(1953)一书中声称“翻译是一种语言操作”。显然这种偏激 的言论招致四面楚歌,被斥责为“语言学的叛逆”,但确实使得译坛异常活跃。后来,R.Ja kobson,I.I.Rovzin和V.J.Rosenzweig,J.Catford,E.Nida等人纷纷著书立说阐明自己的观点 。这其中对于翻译研究的科学论述最有影响且最深刻的当属尤金·奈达先生的《走向科学的 翻译》(1964)。 任何一门成熟的学科都必须与其发展的理论相一致,同时必须经得起实践的检验,并具有 科学的数据和方法。翻译学也不例外。近年来,国内外许多学者相互学习,理论联系实际, 积极探索翻译学的方法论。其中建立翻译语料库便是这一研究的具体体现。 随着计算机技术的迅速发展,语料库已经开始在各个领域中发挥了重要的作用。第一个机 读语料库由Nelson Francis和Henry Kucera于1961年在Brown大学编制而成(汇集了美国英语 1 00万词汇)。其姊妹语料库“英国英语”(Lancaster-Oslo-Bergen)于70年代后期问世。它们 代表了语料库语言学历史中“突出而且成熟”的成就(Clear 1993:164),成为语言学家极为 宝贵的资源。后来,由伯明翰大学建立的COBUILD项目得到了柯林斯出版社的资助,在语 言研究方面取得了重大进展。到了80年代,人们在这一领域的兴趣有增无减,运转语篇的大 型语料库越来越体现出其存在的价值和用途。1989年汇集了1亿词的英国国家语料库问世, 并广泛应用于工业和科研领域中(Clear 1993:167)。同时,人们希望有新的语料库资源能对 翻译产生深远的影响。 把语料库技术应用到翻译研究领域中起始于90年代初期。最早产生的翻译语料库是1996年 由英国曼彻斯特科技大学(University of Manchester Institute of Science and Technol ogy缩写为UMIST)的Laviosa-Braithwaite制作的,并发表了“英语比较语料库:翻译实践研 究的资源与方法”(The English Comparable Corpus(ECC):A Resource and a Methodology for the Empirical Study of Translation)。这是一篇博士论文。随后,该学校的Doroth y Kenny,Mona Baker等人先后改进了翻译语料库。在此基础上,Mona Baker教授建立了翻 译语料库的基本理论并成立了翻译研究中心。Mona Baker(1992:395)提供的证据说明了语 料库技术的发展对翻译现象和性质进行理论研究具有强大的刺激性。众所周知,目的语和源 语在表达方式上总会有一些显著不同的特点。TEC的基本理论则正是针对这些差异建立的。 2.TEC的分类 翻译语料库按照研究目标分为两种类型:描述型和实用型。 描述型是把语料库设计成译文文本分析语料库,并把它们与源文本语料库进行比较,以发 现译文所具有的特点,特别是源语—目的语的结合点(Gelllerstan 1996)以及有可能具有普 遍 意义的译文文本(Baker 1998,Laviosa 1998)。 实用型则是利用语料库来探索人工翻译和机器翻译的过程。基于这样的目标,TEC又可以分 为三种主要形式: 单一语种语料库(Monolingual Corpora)包括某一种语言的文本,可能是某一项翻译的源语 文本,也可能是译文文本。普通的语料库文本类型可以非常广泛;但特殊的语料库则限定文 本风格和/或主题范围。不论哪一种,都必须能在文本群中提供样品,也能够理想地反映该 群体的各种变体(Biber 1993)。 比较语料库(Comparable Corpora)的设计同单一语种语料库相似,只是用于两种和更多的 语言比较。它们可能被当作一些成份。目前比较语料库大都针对不同的文化,在社会语言相 似的文本类型和范围内探索相关的语言变体。(少数例子除外) 平行语料库(Parallel Corpora或Bilingual Corpora)是把包括源语文本及其译本的两种或 更多的语言作为一些成份来进行研究。同样,大多数平行语料库都是专门设计的。主要有两 种形式: