汉藏语历史比较研究的基本方法是利用现实语言或方言材料以及少量历史语言文献资料,依据语言之间同源词或同源形态的语音对应规律进行语言亲属关系的比较研究和原始共同语的构拟研究,研究基本上沿用的是李方桂先生《台语比较手册》所使用的方法,这是一种适合汉藏语系语言特点的历史比较方法。但是汉藏语比较研究迄今仍然面临一定的困难,其主要原因在于汉藏语本身历史发展演变的复杂性,同时传统比较研究方法也是需要进一步完善的。本文拟讨论几个汉藏语比较研究中比较隐性的原则问题,如果能够在基于语料库语言学的比较研究中设定这些处理原则,或许有可能提高比较研究的解释力。当然这些确定汉藏语同源词的处理原则,都是依据现有一些不充分研究成果提出的,能否对更大范围的比较研究具有普遍性,还需要在研究实践中得到验证。 一 语音对应规律的概率论原则 如果没有同源关系,方言之间任何音类的分布概率和对当比率都具有随机性,不应该有显著差别;而实际上如果两个方言音类的加权对当比率显著高于其随机分布概率,这种差别可以解释为是由两种方言的同源关系造成的。所以可以把客位方言的加权对当比率显著高于其随机分布概率的某(些)音类和主位方言对当的某音类定为一条语音对应规律。 下面以两种苗语方言声调对应规律分析(黄行等,1999)为例说明。表中川黔滇苗语“43调1059”表示43调在川黔滇苗语4000多词词表文本中的5299语素(音节)总共出现了1059次,“对当声调”表示主位方言川黔滇苗语43调的1059个语素在客位方言黔东苗语相同词义语素中分别对当着33调、55调、35调、11调、44调、13调、53调、31调和24调(24调是黔东苗语专用于汉语借词的声调)等声调。 川黔滇苗语43调与黔东苗语诸声调的对当关系
说明: “对当声调次数”表示黔东苗语各声调和川黔滇苗语43调所对当的次数。如黔东33调:川黔滇43调861次,黔东55调:川黔滇43调190次,等等。 “随机分布概率”表示黔东苗语各声调的随机分布概率(黔东苗语某声调出现次数/全部声调出现次数的比率)。如黔东苗语33调共出现2070次,全部声调共出现7049次,33调的随机分布概率即为29.37%(2070/7049),55调的随机分布概率为11.76%,等等。 “加权对当比率”表示黔东苗语各声调的加权对当比率(黔东苗语某声调与川黔滇苗语43调对当的次数/黔东苗语该声调的出现次数)。如黔东苗语33调:川黔滇苗语43调861次,黔东苗语33调共出现2070次,33调(对当川黔滇苗语43调)的加权对当比率即为41.59%(861/2070),55调的加权对当比率为22.92%,等等。经显著度检验,黔东苗语33调的加权对当比率41.59%显著高于33调的随机分布概率29.37%(33调加权对当比率后加"*"表示它具有显著的分布差异)。而黔东苗语55调的加权对当比率22.92%并不显著高于55调的随机分布概率11.76%(55调以及黔东苗语的其他各调加权对当比率后则不加"*",表示它们的分布差异不显著)。 就上例而言,尽管主位方言川黔滇苗语43调与客位方言黔东苗语众多的声调对当,但是它仅和黔东苗语33调有显著高的加权对当比率,所以,川黔滇苗语43调(阴平调):黔东苗语33调(阴平调)为一条两个方言之间声调的语音对应规律。 需要指出,这种基于概率论的分析方法要求两个条件。一是比较词项样本应该足够大,否则会因样本误差造成音类对应的差异不显著。二是语言/方言之间的同源词应该主要维持在词的平面(详见第二条同源词的变异和集合原则),所以这种方法之于在词的平面同源词较少的藏缅语可能效果不佳。 二 同源词的语值变异和集合原则 词是语言系统中最基本的元素,它既具有显性的语音、语义和词法特征,又含有隐性的句法结构特征,因此是信息量最多的一个语言结构层级,适于作为比较研究的基本单位。汉藏语系语言发展到后期普遍出现了复合式的构词类型,复合词中的多个词根语素的发生学地位和词的择对关系有时是不同的,因为这类复合词区分同源语素和非同源语素是汉藏语比较研究的一个难点。但是由于语素识别、语素的多义性和语言之间的语素择对等问题尚未有效地解决,因此建立在语素层级的比较研究方法还需要进一步探讨。 和语音、语法相比,词汇的系统性显得最差,每个词似乎都有它独立发生和变化的历史。由于词的历史变异和方言变异是普遍存在的,所以比较研究不仅要注意同源词表层的音义关系,还应该注意词的隐性属性和关系。词的属性标记越多,词之间的函数关系就越明显,据此建立的词的集合越有结构性,进行比较研究的可行性就越大。换句话说,传统汉藏语比较研究方法上的改善应当是把仅仅根据词的音义的比较转换为根据词的诸多属性建立起来的词的集合之间的比较。严学宭先生的词族比较法(严学宭,1979)和邢公畹先生的深层语义比较法(邢公畹,1993)都是以词的集合而非个体的词为比较研究对象,因此可能带来更深入的研究结论。