苗瑶语族语言亲缘关系的计量研究

——词源统计分析方法

作 者:

作者简介:
邓晓华 厦门大学人类博物馆 360000 王士元 香港城市大学电子工程学系

原文出处:
中国语文

内容提要:

运用词源统计分析法对苗瑶语族语言作数理分类,比较传统的分类和其他计量方法的分类结果,认为Swadesh的100词可以用作苗瑶语分类的标准,并描述出苗瑶语族语言之间亲缘距离的程度,同时也说明一种语言中的不同的词汇范畴具有不同的变化程度,即使是基本词汇的变化程度也不能假定为一种相同的值的理论。


期刊代号:H1
分类名称:语言文字学
复印期号:2003 年 08 期

字号:

      一 苗瑶语族语言关系的研究概况

      1.1 传统的苗瑶语分类

      这里只讨论苗瑶语族内部的分类,不涉及有关苗瑶语的系属分类问题。李方桂(Li 1937、1973),赵元任(Chao 1943),董同龢(1953),罗常培、傅懋勣 (1954)对苗瑶语族内部的划分十分相似,都只分为苗语支和瑶语支。苗语支只有苗语,瑶语支只有瑶语,仅两种语言。1954年,法国学者欧德里古尔指出越南的那峨语(又称巴腾语,中国学者称巴哼语)属于苗瑶语族。1959年,《中国少数民族语言简志苗瑶语族部分》将苗瑶语族分为两个语支,苗语支包括苗、布努两个语言,瑶语支仅有勉一个语言。1962年,毛宗武等将“巴哼”话、“炯奈”话、“优诺”话归为布努语的方言。1982年的《瑶族语言简志》仍作此分类。1982年,毛宗武、蒙朝吉认为畲语属苗瑶语族的苗语支。1984年,陈其光反对将畲语划归苗语支,认为应划归瑶语支。1987年,美国学者斯特雷克将苗瑶语族分为七个语支:苗语支包括黔东苗语、湘西苗语、川黔滇苗语和未定的九个语群;瑶语支包括勉金门语、标交语和藻敏语,巴哼语支包括巴哼语和那峨语,另外还有唔奈语支,炯奈语支、优诺语支、畲语支。但他把布努语划归川黔滇下属的方言。从族属看,苗语为苗族语言,有三大方言:湘西、黔东、川黔滇;而巴哼、炯奈、优诺、布努都是瑶族的支系;畲语则为畲族语言。(注:语言学数理分析表明历史上确实存在一个苗瑶共同体。人文学科的研究亦表明苗瑶语民族集团历史演化过程:传说时代的“三苗”→商、周时代的“荆蛮”集团→秦汉、六朝时代洞庭“武陵蛮”、“五溪蛮”→隋唐时代苗、瑶民族→唐宋时代苗、瑶、畲民族。)1995年,王辅世、毛宗武的《苗瑶语古音构拟》修改他们以前的观点,认为苗瑶语族分为三个语支:苗语支包括苗语、布努语、巴哼语(优诺在内)和炯奈语,瑶语支只有勉语,畲语支仅畲语。最近,毛宗武(毛宗武、李云兵 1997)再次修改他原先的观点,他认为苗瑶语族可分为语支、语丛、语言、方言四个层次,苗瑶语族分为苗语支和瑶语支,苗语支下面分为苗语(湘西方言、黔东方言、川黔滇方言),布努语(布努方言、瑙格劳方言、努茂方言),巴哼语(巴哼方言、唔奈方言),优诺语,炯奈语,畲语,其中巴哼语和优诺语为一语丛,炯奈语和畲语为一语丛。瑶语支仅勉语(勉方言、金门方言、标敏方言、藻敏方言)。

      1988年出版的《中国语言地图集》(以下简称“地图”)将苗瑶语族分为苗语支:苗语(黔东方言、湘西方言、川黔滇方言),布努语(布瑙方言、巴哼方言、唔奈方言、炯奈方言、优诺方言5个方言),畲语;瑶语支:勉语(勉金方言、标交方言、藻敏方言)。本文具体分析苗瑶语族的12个语言(方言)。(注:关于语言与方言的分类:由于我国民族语言和方言的分类理论和方法还不完善,还未建立起完整的分类体系,导致语言和方言的界定不清。有些语言学家可能受到传统民族学理论影响,在作语言分类时,往往把独立的语言当作方言来看待,按照传统民族学分类理论(例如斯大林民族理论),一个民族必须具有共同的语言,所以将瑶族讲的“巴哼”话、“炯奈”话、“优诺”话当作同是瑶族讲的“布努”语的方言来分类。实际上,民族学的分类同语言学分类的标准不同,关系错综复杂。词源统计法理论上并没有什么特别对区分语言和方言有效的方法,不过在诠释得到的树图结论时,我们发现苗瑶语族12支语言,放在“语言”层面处理比起把有的视作“语言”,有的视作“方言”来处理更为客观。从我们的数理树图看,“布努”等的分布打破了传统的语言和方言的格局。)

      传统苗瑶语分类的标准,语支分类的依据主要是音韵和同源词。张琨认为,瑶语是指完全保留或大部保留p、t、k、m、n、η这套辅音韵尾的;苗语没有这些辅音韵尾,或至多有n和η。(但他认为这种分类法一般同这两个汉语名称所指的民族学上的分类一致的观点却是错误的)此外,苗语支的语言声母比韵母多,苗、布努、畲语元音不分长短;而瑶语一般韵母较声母复杂,元音分长短。瑶语浊的塞音和塞擦音声母可以出现在各个声调。按照张琨的观点,苗语支内部的语言和方言之间的分类主要依据是:(1)带前置鼻音的塞音和塞擦音声母mp、nt、ηk、ηq、nts、ntr、nt出现的情况。(2)有没有复辅音声母。(3)小舌音q是否与舌根音k对立。(4)各种鼻音的对立和各种边音的对立。

      1.2 亲疏关系的计量分析

      有关苗瑶语的分类,除了传统的做法外,还有最近黄行做的苗瑶语方言亲疏关系的计量分析研究,黄行的研究出色,并取得成绩。黄先统计出苗瑶语方言声韵调平均的相关系数,后作方言亲疏关系的聚类统计。我们跟黄虽然都依据语言学的计量统计方法来作苗瑶语的分类,但不同之处在于:

      1)使用的材料不同。黄依据王辅世、毛宗武《苗瑶语古音构拟》的800词作声韵调音类的相关统计;我们则主要依据Swadesh的100词表作同源词的数理分析。而Swadesh的100词至少是目前国际语言学界公认的作历史语言学比较的最佳优选词目,同时具有较强的可操作性。Swadesh的100基本词是经过许多语言检验过的一组能反映语言纵向分化的词表,这组基本词不容易受到借用的影响,词义有较高的稳定性。所以做统计时可以保证因借用而造成统计的干扰很小。当我们扩大统计的范围,比如王、毛的800词,要剔除其中借词的难度就大多了,特别是来自语族外部的借用。我们发现苗瑶语中有许多汉语的借词,即使在100词里我们也发现了“沙”、“眼”等词来自古汉语。当统计的词汇表扩大到大量的文化词时,这些借用对统计的影响就会造成很大的影响。更重要的是我们这里进行的是亲缘关系的分析,需要考虑的是共享词汇的保留率,所以基本词就可以反映这个关系,我们在Swadesh的100词的基础上针对苗瑶语的情况做了尽可能小的修改,把统计的词汇表增加至110词,目的就是既保证使用一个普适的统计根据,又不失考虑苗瑶语的特殊情况。从词源统计法的角度看,选取的词目越多,则相互借用的可能概率就会越高。

      2)得到树形图的方法的不同。黄用聚类分析中的平均连结的方法,我们用构造种系发生树形图的距离法中的Fitch-Margoliash和Neighbor joining法。黄行的工作得到的是语言之间亲疏关系的表示。而我们采用的是广泛应用于生物学上研究种系发生学关系的方法,目的是得到一个亲缘关系的表示。不仅得到语支的分化顺序,而且从树图上可以用树枝的长短表示语言之间的距离,可以看出语言变化的不同速度。而且我们考虑了汉语以一个外部语言作为基准来看苗瑶内部的分化。这是前面研究没有做的。(注:有关语言亲疏关系与亲缘关系的不同的研究方法的比较可参考王、沈(1992)的文章。)我们所使用的距离法的优点是,树上的所有语言都能相互比较,而不仅仅是一次只能考察一对语言。而且语言离根部路径的长度通常是有差别的,表明它们彼此都有一个共同的起点,即树根。而较早的距离法得出的树的末端离根部是等距离的,如平均值联系和不加权每对集合的数学均值(UPGMA)。因为这些较早的方法假定变化率是恒定的,我们在此不考虑这些方法。

相关文章: