中国境内的混合语及语言混合的机制

收藏 |打印|下载word

作者：

徐丹

作者简介：

徐丹，女，法国国立东方语言文化学院教授，法国国家科学研究中心东亚语言研究所兼职研究人员，主要研究方向为汉语句法、语言类型学、语言接触,E-mail：xudan@ehess.fr（法国巴黎 75006）。

原文出处：

语言战略研究

内容提要：

文章分析了倒话、五屯话和唐汪话这3个在中国境内被认为是混合语的语言。我们初步为识别混合语建立了一个量化的标准。我们提出，句法借贷较之词汇借贷是判定语言是否混合的更可靠的标准。如果某一个语言的句法借贷达到了45%，那么两个语言（借者和贷者）就会发生混合。如果是词汇借贷达到了同一个程度，语言不一定发生混合。语言混合的机制来自语言的外在因素。

期刊代号：H1

分类名称：语言文字学

复印期号：2018 年 09 期

关键词：

混合语词汇借贷句法借贷量化机制　　mixed language lexical borrowing syntactic borrowing quantification mechanism

字号：大中小

随着语言接触研究的深入开展，我们看到，语言接触无所不在，是世界范围内常见的现象。有不同人群的地方就有语言接触，有语言接触就会发生借贷。这种借贷往往是双向的。强势或弱势语言都可以是借者或贷者。长期的语言接触和民族之间的交往、贸易、战争、通婚、共同宗教信仰等因素，使语言不可避免地会发生“混合”①。本文将结合中国境内的倒话、五屯话和唐汪话讨论这一问题，并试图通过量化标准探讨如何识别和定义混合语。

一、混合语

到目前为止，关于混合语的研究虽然不是热门话题，但学者们一直对这个题目感兴趣。比如人们公认的几个混合语是美国加拿大边界地区的Michif。该混合语形成于19世纪左右，其动词范畴来自Cree（当地土著印第安妇女），名词范畴来自法语（来自当时法国的皮货商）。再如白令海峡Copper Island岛屿的Mednyj Aleut语言，这个语言也是形成于19世纪，是当时俄国商人和当地土著妇女结合而形成的语言。世界上还有一些混合语，请详见Thomason和Kaufman（1988）、Matras和Bakker（2003）等学者的著作②。但是到目前为止，学术界暂无一个约定俗成或放之四海而皆准的标准，更不要说量化的标准。

量化一直是语言学研究的软肋。从20世纪60年代以来（参见Herdan 1964），计量语言学开始发展。尤其是近十几年来，分子人类学、计算机语言学的学者运用量化的方法探讨语言的演变后，语言研究的量化问题开始得到重视和挖掘。Wang S.Y.William（1994）、王士元和沈钟伟（1992）、郑锦全（1994）、Cheng Chin-Chuan（1996）等学者很早就对这一领域进行了开拓性研究。本文尝试着用最普通的统计标准③判定混合语。我们将从两个方面进行量化的测试。一个是从词汇方面，一个是从句法方面。在词汇方面，语言学家们一直是通过20世纪50年代Swadesh建立的100词表或200词表进行同源词研究、语言之间距离的研究或语族、语系相似度的研究。Swadesh（1955）也是受到了20世纪40年代化学和考古学碳-14衰变规律的启发而建立的测试方法。自从他的词表问世以来，各种批评从未间断过。人们都已达成共识，用词表时需要根据不同语言做不同判断，各语言演化速度不同，词汇衰变率也不一致。但时至今日，还没有任何一个量化的标准能够将其取而代之。现在我们看到的任何有大数据基础的统计方法（如Starostin 2000；Wichmann & Holman 2009；Pagel et al.2013；Wichmann et al.2013；Greenhill 2017；等）都采用了Swadesh的词表。陈保亚（1996）通过这一词表，对中国壮侗语言和汉语词汇进行过量化统计；孟和达来和黄行（1997）对北方非汉语言进行过同源词差异的统计。这些研究的目的都是一个，从语言借词的比例上确认某一语言受到另一个语言的影响深度。我们的研究也不例外，也将利用100词表和200词表。前人的经验表明，这两个词表是语言学研究不可缺少的量化工具。

Bakker和Mous（1994：5-6）对混合语的混合度有过探讨。他们认为，词汇借贷达到90%时，语言就发生混合了。我们将讨论这一量化标准，并将论证这一标准不能反映实际的语言情况。因为词汇借贷只是一个方面。句法借贷的标准也应该量化才能做出相对可靠的结论。Greenhill（2017）指出，词法和句法的衰变速率是不同的，句法比词汇变化的速度快。他的词汇标准来自语言学家通用的Swadesh词表，句法标准除了句法特征，还包括了语音标准。我们在讨论混合语标准时，把词汇和句法都看成是量化的对象，尽量采用可以量化的标准。词汇方面利用了Swadesh的词表，句法方面暂无统一的现成标准④，我们尝试着建立了一些探索性质的句法测试标准，得到了一些初步的认识和结果（Xu Dan 2017）。

二、中国境内的混合语

在孙宏开、胡增益、黄行（2007）主编的《中国的语言》这部著作里，倒话、五屯话、唐汪话被放在“混合语”一章里。通过笔者初步的研究，即通过词汇借贷和句法借贷两个标准观察这3个语言，其混合度是不同的。在词汇层面上，五屯话的借贷水平远远高于倒话和唐汪话；在句法层面上，倒话的混合度最高，五屯话的混合度次之，唐汪话的混合度最低，后者暂时还未成为混合语。我们先简介一下这些语言的情况，然后再用量化的标准论证我们的观点。

倒话的研究可以参见意西微萨·阿错的《倒话研究》（2004）。根据意西微萨·阿错（2004）的研究，倒话在四川省甘孜藏族自治州雅江县河口镇一带使用。倒话深受当地藏语方言影响。作者指出，倒话的基本词汇及音系来自汉语，句法表达方式则来自藏语。讲倒话的人都“保存着汉族姓氏，只是汉族‘姓’之后的‘名’大多则采用了藏语名”（意西微萨·阿错2014：194）⑤。倒话的语序和其他藏语方言一样，都是宾动语序。有格标记，格标记的核心标记采取了作格/通格类型的标记，而不同于甘青一带主格/宾格标记类型的语言。这种截然不同的标记类型与这些语言所处的地理位置是分不开的。换句话说，一个语言的类型与其地理上毗邻的语言类型往往是相近的，甚至是趋同的。

五屯话在青海黄南藏族自治州同仁县隆务镇一带使用。五屯话的研究可以参见陈乃雄（1982，1988，1989）、Li（1985）、Janhunen等（2008）、Sandman（2012）等人的研究。如上所述，五屯话在地理上既受到青海藏语深刻的影响，又被青海的保安语包围，保安语属于蒙古语族。这意味着，五屯话同时受到藏语和保安语的影响。五屯话也是宾动语序，有格标记。但有意思的是，五屯话格标记类型属于主格/宾格类型，即与紧邻蒙古语族诸语同类型，而非属于藏语的作格/通格类型。

共18条结果上一页12 3 4 5 6 下一页全部展开

藏缅语疑问语气助词的类型学特征　　

戴庆厦

语言文...2024年第08期
从儿童语言习得过程看转喻与隐喻的特征

束定芳

语言文...2024年第08期
中国英语学习者的构式表征联结：来自跨构式...

洪霞

语言文...2024年第08期
基于神经网络模型的翻译语义质量量化评价

王金铨

语言文...2024年第08期
汉英文学翻译中隐喻动词的使用研究

冯聪

语言文...2024年第08期

中国境内的混合语及语言混合的机制

相关文章：