藏缅语族语言的数理分类及其分析

作 者:

作者简介:
邓晓华 王士元 361005 厦门 厦门大学人类学博物馆 香港城市大学电子工程学系

原文出处:
民族语文

内容提要:

本文运用词源统计分析法,对中国境内的藏缅语族语言作出数理分类以及亲缘关系程度的描述,并通过树枝长短来表示距离关系。显示藏缅语族语言的类簇和分级层次,分析其形成过程。


期刊代号:H1
分类名称:语言文字学
复印期号:2003 年 11 期

关 键 词:

字号:

      藏缅语族是汉藏语系中语种最多、分布最广、内部差异最大的一个语族。在中国,使用藏缅语族的民族有:藏、门巴、珞巴、景颇、独龙、怒、羌、普米、彝、哈尼、阿昌、拉祜、基诺、傈僳、纳西、白、土家等17个民族,据1987年《中国语言地图集》(以下简称《地图》)公布中国境内的藏缅语族语言共有23种。而据最近的研究(1997),中国境内的藏缅语族语言则已增加到36种,原因是发现了一些新的语种,例如,木雅、道孚、扎巴等。就国内外藏缅语族语言的数量来说,分歧较大,国内学者认为100余种,而马提索夫则认为至少有250种。主要原因是划分语言和方言的标准不统一。藏缅语族语言人口约1500万。

      一 藏缅语族语言的传统分类

      19世纪50年代开始认识藏语跟缅语有同源关系。最早英国学者Konow Sten《印度语言调查》(1903-1928)藏缅语分9个分支。1937李方桂《中国的语言和方言》采用谱系树分类,分藏缅语族为藏、景颇、缅、彝4个语群;分语群和语言2级。罗常培、傅懋績《国内少数民族语言文字概况》藏缅语族分类近似李,分4个语支。而《地图》则分藏缅语族23种语言为7类:藏、嘉戎、错那门巴、仓洛门巴;羌、普米;博戈尔珞巴、义都珞巴、格曼僜语、达曼僜语;独龙、景颇;载瓦、阿昌;彝、纳西、白、傈僳、怒、拉祜、哈尼、基诺;土家语。

      戴庆厦(1989)分藏缅语族为南北两大语群。孙宏开分藏缅语族为5个语支,增设羌语支,即藏、羌、彝、缅,景颇。孙1994年又增加了中国境外藏缅语族语言,作全面的藏缅语族分类。此外,本尼迪克特和马提索夫也对藏缅语族进行了分类。

      不难看出,上述分类的标准主要有:语音面貌,语法范畴,语汇系统即同源词的多寡和对应关系的远近。以上分类除了国外藏缅语,涉及国内藏缅语问题的主要分歧有:1.羌语是否单列一个语支,瞿蔼堂归藏语支,戴庆厦归嘉戎—独龙语支,孙宏开单列。2.白语的归属,两种意见:一是归汉语族。格林伯格1953《历史语言学和无文字语言》认为白、汉有发生学关系,主张白语归汉语族,本尼迪克特同意此观点,划归汉语族。郑张尚芳同此观点。二是归藏缅语族。或单列独立语支,或归入彝语支。戴庆厦单立、孙宏开、吴安其归入彝语支。他们都认为白、汉是接触关系,而非发生学关系。

      二 藏缅语族语言的计量分类

      1.分类的标准和方法

      100词及数量方法。本文主要运用词源统计分析的理论和方法来作藏缅语族语言的亲缘关系分类。词源统计分析法的基本观念是两种具有亲缘关系的语言分离的时间深度,可以通过它们继承的词的共享程度来判断。词源统计分析法最初由Swadesh提出,近年来,由于理论的发展和计算机的巨大进步,词源统计分析法又受到历史语言学家的重视。王士元(1995)曾运用该方法作出壮侗语族的分类。

      我们主要依据Swadesh的100词表作同源词的数理分析,同时参考选择雅洪拖夫的35词表,具体分析了藏缅语族的12种语言,(注:该文表中汉语缩写“拉”代表Lasa、“阿”代表Alike、“羌”代表Qiang、“普”代表Pumi、“嘉”代表Jiarong、“景”代表Jingpo、“缅”代表Yangguang、“彝”代表Sani、“哈”代表Mojiang、“纳”代表Naxi、“白”代表Bai、“土”代表Tujia,“OC”代表古汉语。文中不再作说明。)最后画出藏缅语族语言树形图。树形图包含两个重要的信息:(1)语言集团的呈阶级式的聚合分类;(2)树枝的长度可以反映语言从祖语分离的时间距离以及各语言间亲缘程度。

      2.数理分类的主要步骤

      (1)相似矩阵(Similarity Matrix)

      首先优先出同源词,编制同源词表,然后计算出每对语言的同源百分比。

      拉 阿 羌 普 嘉 景 缅 彝 哈 纳 白 土 OC

      拉 92 54 49 53 44 52 51 55 54 33 35 31

      阿 52 50 52 43 52 52 55 51 31 33 31

      羌 79 73 56 60 58 60 65 40 40 34

      普 74 46 65 63 66 64 34 32 34

      嘉 49 63 60 60 59 34 37 33

      景 54 43 48 50 34 33 28

      缅 67 69 68 34 35 32

      彝 72 61 31 37 30

      哈 72 34 38 32

      纳 32 33 31

      白 23 33

      土 20

      (2)距离矩阵(Distance Matrix)

      由于数理树形图是通过分枝的长度来反映语言间的距离的,所以,我们必须把上面的相似矩阵转换为距离矩阵(Distance Matrix)。

      

      (3)从无根树到有根树

      从距离矩阵转换成无根树有许多种方法,所有这些方法都需要大量的计算。生物学家为生物种系发生分类设计出很好的计算程序。我们采用的计算程序,则是最有影响的,1967年由Fitch和Margoliash发明的程序,以及1987年由Saitou和Nei发明的程序。

相关文章: