随着语言接触研究的深入开展,我们看到,语言接触无所不在,是世界范围内常见的现象。有不同人群的地方就有语言接触,有语言接触就会发生借贷。这种借贷往往是双向的。强势或弱势语言都可以是借者或贷者。长期的语言接触和民族之间的交往、贸易、战争、通婚、共同宗教信仰等因素,使语言不可避免地会发生“混合”①。本文将结合中国境内的倒话、五屯话和唐汪话讨论这一问题,并试图通过量化标准探讨如何识别和定义混合语。 一、混合语 到目前为止,关于混合语的研究虽然不是热门话题,但学者们一直对这个题目感兴趣。比如人们公认的几个混合语是美国加拿大边界地区的Michif。该混合语形成于19世纪左右,其动词范畴来自Cree(当地土著印第安妇女),名词范畴来自法语(来自当时法国的皮货商)。再如白令海峡Copper Island岛屿的Mednyj Aleut语言,这个语言也是形成于19世纪,是当时俄国商人和当地土著妇女结合而形成的语言。世界上还有一些混合语,请详见Thomason和Kaufman(1988)、Matras和Bakker(2003)等学者的著作②。但是到目前为止,学术界暂无一个约定俗成或放之四海而皆准的标准,更不要说量化的标准。 量化一直是语言学研究的软肋。从20世纪60年代以来(参见Herdan 1964),计量语言学开始发展。尤其是近十几年来,分子人类学、计算机语言学的学者运用量化的方法探讨语言的演变后,语言研究的量化问题开始得到重视和挖掘。Wang S.Y.William(1994)、王士元和沈钟伟(1992)、郑锦全(1994)、Cheng Chin-Chuan(1996)等学者很早就对这一领域进行了开拓性研究。本文尝试着用最普通的统计标准③判定混合语。我们将从两个方面进行量化的测试。一个是从词汇方面,一个是从句法方面。在词汇方面,语言学家们一直是通过20世纪50年代Swadesh建立的100词表或200词表进行同源词研究、语言之间距离的研究或语族、语系相似度的研究。Swadesh(1955)也是受到了20世纪40年代化学和考古学碳-14衰变规律的启发而建立的测试方法。自从他的词表问世以来,各种批评从未间断过。人们都已达成共识,用词表时需要根据不同语言做不同判断,各语言演化速度不同,词汇衰变率也不一致。但时至今日,还没有任何一个量化的标准能够将其取而代之。现在我们看到的任何有大数据基础的统计方法(如Starostin 2000;Wichmann & Holman 2009;Pagel et al.2013;Wichmann et al.2013;Greenhill 2017;等)都采用了Swadesh的词表。陈保亚(1996)通过这一词表,对中国壮侗语言和汉语词汇进行过量化统计;孟和达来和黄行(1997)对北方非汉语言进行过同源词差异的统计。这些研究的目的都是一个,从语言借词的比例上确认某一语言受到另一个语言的影响深度。我们的研究也不例外,也将利用100词表和200词表。前人的经验表明,这两个词表是语言学研究不可缺少的量化工具。 Bakker和Mous(1994:5-6)对混合语的混合度有过探讨。他们认为,词汇借贷达到90%时,语言就发生混合了。我们将讨论这一量化标准,并将论证这一标准不能反映实际的语言情况。因为词汇借贷只是一个方面。句法借贷的标准也应该量化才能做出相对可靠的结论。Greenhill(2017)指出,词法和句法的衰变速率是不同的,句法比词汇变化的速度快。他的词汇标准来自语言学家通用的Swadesh词表,句法标准除了句法特征,还包括了语音标准。我们在讨论混合语标准时,把词汇和句法都看成是量化的对象,尽量采用可以量化的标准。词汇方面利用了Swadesh的词表,句法方面暂无统一的现成标准④,我们尝试着建立了一些探索性质的句法测试标准,得到了一些初步的认识和结果(Xu Dan 2017)。 二、中国境内的混合语 在孙宏开、胡增益、黄行(2007)主编的《中国的语言》这部著作里,倒话、五屯话、唐汪话被放在“混合语”一章里。通过笔者初步的研究,即通过词汇借贷和句法借贷两个标准观察这3个语言,其混合度是不同的。在词汇层面上,五屯话的借贷水平远远高于倒话和唐汪话;在句法层面上,倒话的混合度最高,五屯话的混合度次之,唐汪话的混合度最低,后者暂时还未成为混合语。我们先简介一下这些语言的情况,然后再用量化的标准论证我们的观点。 倒话的研究可以参见意西微萨·阿错的《倒话研究》(2004)。根据意西微萨·阿错(2004)的研究,倒话在四川省甘孜藏族自治州雅江县河口镇一带使用。倒话深受当地藏语方言影响。作者指出,倒话的基本词汇及音系来自汉语,句法表达方式则来自藏语。讲倒话的人都“保存着汉族姓氏,只是汉族‘姓’之后的‘名’大多则采用了藏语名”(意西微萨·阿错2014:194)⑤。倒话的语序和其他藏语方言一样,都是宾动语序。有格标记,格标记的核心标记采取了作格/通格类型的标记,而不同于甘青一带主格/宾格标记类型的语言。这种截然不同的标记类型与这些语言所处的地理位置是分不开的。换句话说,一个语言的类型与其地理上毗邻的语言类型往往是相近的,甚至是趋同的。 五屯话在青海黄南藏族自治州同仁县隆务镇一带使用。五屯话的研究可以参见陈乃雄(1982,1988,1989)、Li(1985)、Janhunen等(2008)、Sandman(2012)等人的研究。如上所述,五屯话在地理上既受到青海藏语深刻的影响,又被青海的保安语包围,保安语属于蒙古语族。这意味着,五屯话同时受到藏语和保安语的影响。五屯话也是宾动语序,有格标记。但有意思的是,五屯话格标记类型属于主格/宾格类型,即与紧邻蒙古语族诸语同类型,而非属于藏语的作格/通格类型。