汉语史研究中的语料使用问题  

作 者:

作者简介:
汪维辉,浙江大学汉语史研究中心,E-mail:wangweihui@zju.edu.cn;胡波,浙江大学汉语史研究中心,E-mail:amberhubo@163.com。

原文出处:
中国语文

内容提要:

恰当使用语料是进行科学的汉语史研究的前提。语料使用主要涉及两个问题:一是语料的选择,基本要求是口语性和可靠性;二是语料的分析,包含确认有效例证、剥离口语成分、分析统计数据和重视典型语料四个方面。文章就上述问题发表了看法,并提出了“以典型赅非典型”和“以前期赅后期”两条原则。通过对唐代一些典型语料的考察,文章认为至晚到中唐时期“不是”已经在口语中基本取代了“非”,系词“是”已经发展成熟。


期刊代号:H1
分类名称:语言文字学
复印期号:2013 年 10 期

字号:

      恰当使用语料是进行科学的汉语史研究的前提。语料使用主要涉及两个问题:一是语料的选择,二是语料的分析①。两者又是相互关联的。下面分别讨论。

      一、语料的选择

      用于汉语史研究的语料有两个基本要求:一是口语性,二是可靠性(参看汪维辉,2000b)。

      关于语料的可靠性问题,太田辰夫先生(2003:373)曾经有过经典性的论述:“在语言的历史研究中,最主要的是资料的选择。资料选择得怎样,对研究的结果起着决定性的作用。”太田先生所说的“资料选择”,主要就是材料的可靠性问题。这一观点已经成为汉语史学界的共识,深入人心。虽然在研究实践中使用不可靠语料的问题仍然时有所见(参看王魁伟,2000;董志翘,2006;麻爱民,2010等),但这主要不是认识问题,而是个人学养或治学态度等问题,这里就不赘述了。

      我们所要研究的汉语史就是口语发展史,所以据以得出结论的材料理应是口语性语料。多年来,我们一直致力于探索如何依据口语性语料来探明汉语史上各种问题的真相,并做过一些尝试(汪维辉,2000a、2001、2002、2007等)。

      问题的复杂性在于,汉语的历史文献虽然无比丰富,但是语言性质却十分驳杂,纯口语资料是很难找到的(朱庆之,2012:203),特别是晚唐五代以前。因此有人会说,在缺乏纯粹的口语语料的情况下,退而求其次,带有一些口语成分的语料也是可以而且应该使用的。这话没错,问题是怎样使用。只要我们能对语料做科学的分析,那么理论上一切历史文献都可以用作汉语史研究的资料。

      二、语料的分析

      蒋绍愚(1998)曾经指出:“不但要做好语料的整理工作,而且要做好语料的分析工作。语料有文字讹误、后人擅改,以及时代、真伪等问题,需要通过校勘学、文献学的方法加以鉴别和改正,这是语料的整理。语料本身没有问题,但语料中反映的语言特点有的是时代特色,有的是地域特色,有的是语体特色(如有的很口语化,有的文白夹杂),需要加以区分,这是语料的分析。不注意语料的整理,把有问题的语料作为研究的依据,当然会造成大错;对语料不加分析,把地域或语体的特点当作时代的特点,在作语言史的研究的时候同样会发生错误。语料整理的问题,现在一般比较注意了,语料分析的问题,还需要特别强调。语音研究方面,已有学者提出‘剥离法’,在语法和词汇研究方面,不少语料也是需要‘剥离’的。只有在正确分析语料的基础上,才能作可靠的语言史的研究。”

      蒋先生十几年前的这段话,至今仍值得每一位汉语史研究者深思,因为在目前的研究实践中,语料分析的重要性没有引起应有的重视,语料分析的方法更是有待大家共同来探索。

      我们认为,语料的分析至少应该包含这样四个方面:一是确认有效例证,二是剥离口语成分,三是分析统计数据,四是重视典型语料。后三点又是相互联系的。下面分别论述。

      1.确认有效例证

      所谓“确认有效例证”,实际上主要是一个正确理解文意(包括断句和认字等)以避免“假例”的问题。这里试举一例。李焱、孟繁杰(2011)引例多有问题,仅举下面两例:

      地气反寒暄,天时生杀。(白居易《桐花》)

      世间滋味,尝尽酸咸苦涩。时今食蔗,无甜汁。(唐致政《感皇恩》)作者认为其中的“倒”是关联副词,实际上都不是。《桐花》例“倒”与“反”对文,是动词“倒过来了”“反过来了”的意思;《感皇恩》例是用典,《世说新语·排调》:“顾长康啖甘蔗,先食尾。人问所以,云:‘渐至佳境。’’“倒食蔗”就是倒过来吃甘蔗,所以“无甜汁”。只要稍作分析,这种“假例”本来是可以避免的。

      正确理解文意是从事文献语言研究的必要前提,而目前的汉语史研究中此类“假例”问题并不鲜见(参看汪维辉,1996;史文磊,2008;刘君敬,2008;张海媚,2010;麻爱民,2010;王虎,2012等的分析),限于篇幅,不再细说。

      2.剥离口语成分

      正如蒋绍愚(1998)所说,跟语音研究一样,“在语法和词汇研究方面,不少语料也是需要‘剥离’的”。语料分析最重要的一点其实就是“剥离”,即把文言性成分和口语性成分“剥离”开来,因为在浩如烟海的历史文献中,纯口语资料是不多的,文献语言的基本形态是文白混杂,只有把其中的口语性成分“剥离”出来,才能据此探明历代口语的真相。这个问题下面再结合实例作详细分析。

      3.分析统计数据

      定量研究作为一种科学方法,在汉语史研究中正被越来越广泛地使用。但是科学的方法必须科学地运用才会有效。

      目前比较常见的做法是:选取若干种语料,统计其中研究对象的出现次数,然后依据出现频率得出相应的结论,而不管所统计的语料是否具有“同质性”和研究对象所出现的具体语境如何。这种方法可以称之为“‘一锅煮’统计法”。这样的实例随处可见。我们认为这种做法缺乏科学性,它往往难以导出合乎实际的结论。下面举个例子。

相关文章: