[提要]作者通过对语言接触进行追踪分析发现深刻接触也可以在基本词汇甚至核心词中形成有严格语音对应的关系词,因此仅靠关系词还不能确定同源关系。我们还发现语言的接触是有阶的,越是核心的词汇受到冲击的量越小,时间越晚,于是我们根据接触的有阶性把核心词分成前100词集和后100词集两个不同的阶。在语言接触中,前100 词集的关系词低于后100词集的关系词,在语言分化中情况正好相反。 汉语和侗台语古代关系词的分布属于前一种情况,由此我们认为侗台语和汉语没有同源关系。由于侗台语和汉语之间有大量古代关系词,用语言联盟解释这种密切接触关系比较合理。 汉台(侗台)语源关系是汉藏语系乃至南岛语系发生学问题的焦点。目前确定汉台有无同源关系的难点在于汉台之间有语音对应的早期关系词到底是同源词还是古借词。区分古借词和同源词很困难,因为借词并不是没有规律的,仅仅靠语音对应还难以把古借词和同源词区分开来。国外学者本尼迪克特(1972)等认为汉台之间没有同源关系,理由是汉台之间有音义联系的早期关系词不是基本词汇,尤其不是核心词。 问题在于什么是基本词汇和核心词。李方桂、邢公畹、罗美珍、郑张尚芳等找到的有语音对应的汉台关系词有不少是最基本的生活词汇,还有不少包括在斯瓦迪士(Swadesh,M.)50年代提出的200核心词中。由于目前国内外还没有人拿出更合理的核心词体系(这本身是一项非常困难的工作),斯瓦迪士的200 核心词一直是多数国内外学者在调查研究中共同默认的一项重要参考标准。既然我国学者找到的汉台关系词有不少属于斯瓦迪士的200核心词, 本尼迪克特等说它们是借词的理由并不充分。 基本词汇和核心词可不可以借用,有无语音对应规律?笔者用几年时间对傣语和汉语西南官话的接触作了追踪调查,发现基本词汇和核心词也可以借用,而且符合严格的语音对应规律,因此部分基本词汇和核心词的对应还不是确定同源关系的充分条件。 本文是我在徐通锵先生指导下写出的博士论文的一部分,论文题目是《论语言接触与语言联盟—汉越(侗台)语源关系的解释》。 一 亲属语言之间关系词的分布 根据我们对傣语和汉语西南官话的追踪分析,我们发现尽管核心词也可以相互借用,但越是核心的词借用越少。相反,傣语各方言之间越是核心的词同源词越多,这说明关系词的分布在语言的分化和语言的接触中并不相同。我们正好可以由此入手来区分同源关系和接触关系。于是区分核心词的等级就成了关键的问题。 在没有人提出更好的核心词以前,为了排除研究者个人意向对选择核心词的干扰,我们仍选择斯瓦迪士200核心词作为分析的前提, 因为这200核心词实际上是斯瓦迪士、R.B.Less、J.H.Greenberg等许多学者在分析欧洲、美洲、非洲和澳洲语言的基础上提出和完善的,尽管我们现在仍然可以对这200词中某些词的选择提出异议,但该200词中绝大多数词的选择在世界上其他语言中有普遍性,其他少数学者根据自己所研究的少数几种语言而提出的核心词和斯瓦迪士200词相比普遍性更低, 在下面的研究中我们还会看到,区分同源和接触关系时更重要的问题不在于核心词本身,而在于不同等级的核心词的分布差异。 我们将把核心词分成不同的阶,并用大量材料来证论这种分阶对区分同源和接触关系的可行性。让我们先把200核心词分成两组, 分组的要求是其中第一组的词从概率上看应该比第二组的词更稳定,为了达到这种目的,我们先回顾一下斯瓦迪士200核心词的实质。 斯瓦迪士提出200词是为了通过词汇变化率的统计来确定语言分化的年代。 最初他认为200词可以作为人类语言最稳定的核心词(Swadesh,1952), 但在实际工作中他发现200核心词也可以借用,他又重新确定了一个100核心词(Swadesh,1955),认为这100核心词是人类语言最稳定的核心词, 斯瓦迪士的语言接触观念是有界的,他想在借用和不借用之间划出绝对的界线,但在我们后面的分析中会看到,100核心词也可以借用。 与斯瓦迪士的有界观不同,我们把斯瓦迪士的100词称为前100词集或一阶核心词,然后从斯瓦迪士的200词中减去属于100词的词,得到107词, 再去掉一些词义重复不便比较的词,得到另一个100词,我们称为后100词集或二阶核心词。在下面的大量统计材料中我们会发现尽管前100 词集中的词也可以借用,但比起后100词集的借用率要小得多, 从概率统计上讲要比后100词集相对稳定。 我们区分同源和接触关系就是要根据这种相对稳定性。〔1〕 现在我们来看世界上一些已知有亲属关系的重要语群两阶关系的分布。先看印欧语言古代和现代同源词在第一阶和第二阶中的分布。斯瓦迪士1952 年给出了这些语言古代和现代同源词在200 词中的百分比, 1955年又给出了这些语言古代和现代同源词在100词中的百分比, 我们现在需要确定后100词集的百分比。我们设X为200词中的同源百分比, X[,1]为前100词(第一阶)中的同源百分比,根据公式X[,2]=2X -X[,1]就可算出后100词集中同源百分比(X[,2])。现将计算结果和前100词集比较列入表: