汉语作为世界上方言现象最复杂的语言之一,其各类方言都有它独特的语言特点,是我国丰富多彩文化的重要组成部分。各方言之间、方言区内部各方言片之间,都存在着不同程度的联系和差别。方言差异在一定程度上能够体现地区间的文化、历史差异,反映人口迁移、民族融合等人类社会活动规律。因此,度量方言之间的差异一直是方言学研究中的重要课题之一。 语言是词汇、语法、语音、语境等要素的综合体,方言作为语言的变体也不例外。有很多学者从词汇、语法和语音等方面研究汉语方言差异。例如,在词汇方面,李如龙把汉语方言之间的词汇差异分为源流差异、意义差异、构词差异、价值差异和音变差异,并以各个地方的方言举例说明;董绍克研究了方言词汇的构词差异,从语音、语素和构词类型三方面对方言词汇的构词特点作出探讨①。在语法方面,赵秀莉从构词法、词类、较有特点的句法及复句等方面描写了曲阳方言与普通话的语法差异②;彭小川和林奕高则从计量的角度探讨了汉语方言语法比较研究的效度问题,指出“准确度”和“深度”直接影响比较研究的效度高低③。至于语音方面的研究就更多了,因为方言语音是我们最直接感受到方言差异的一个方面,最能直接、具体地显示方言的特点,汉语方言的调查研究也是从方言语音的调查开始④的。并且,与语法和词汇相比,方言的语音差异有非常明显的规律性,特例相对较少,再加上语音记录方法的规范性,计算起来相对简单,因此,大多数方言差异的计量方面的研究都是围绕着语音分析展开的。 自20世纪70年代开始,不少国内学者开始从计量的角度研究汉语方言的亲疏关系,为方言差异的度量做出了很多尝试和应用。汉语方言语音的差异体现在它们的声韵调上,相关研究的学者们基本都是以此为基础考察方言语音的差异。至于如何通过方言语音声韵调的差异来度量方言差异,学者们莫衷一是。陆致极将《汉语方音字汇》作为基本材料,根据中古声钮将声母部分分成若干单元,根据韵摄将韵母部分先分为若干类,再根据中古韵部、四声和“等呼”的情况将每一类分为若干单元,然后,统计每个单元中同一中古声母(或韵母)的字在现代方言中分化成不同声母(或韵母)的字的数量分布,以此计算两方言的相关系数⑤。杨鼎夫则把所选方言点出现的所有声母、韵母和声调列出来,某个方言点出现某个声母、韵母或声调,则在该位置标为“1”,否则为“0”,以此计算各个方言间的相关系数⑥。类似地,肖双荣和吴道勤二人根据102个县市的84个汉字的语音数据,列出每个汉字在这些县市的所有声韵调,这些县市在相应汉字的声韵调处记为“1”,其他记为“0”,同样以此计算各方言间的相关系数,并进行聚类分析⑦。 发音特征在语音研究方面有不可忽视的作用。发音特征是语音发生过程中,对发音器官主要动作属性的描述。外围主流语音实验室曾探讨过如何将发音特征引入英语识别系统,张晴晴等人基于发音特征建立的声学模型在语音识别方面也取得了不错的效果⑧。陈海伦甚至认为,所有语音之间的差别,部可以归纳为一组有限的发音学特征上的差别。他把跳跃式的一对区别特征记为一个基本计量单位,把渐变式的一对区别特征视情况记为一个基本计量单位的几分之几,然后以区别特征的量的多少衡量语音相似程度,据此计算了方言间韵母系统的相似度⑨。之后,他又讨论了声母及声调偏离的具体计算方法,并对韵母偏离计算方法加以改进⑩。 本文将从声母、韵母和声调这三个方面来量化汉语方言的语音特征,并在此基础上度量汉语方言在地区之间的差异。尽管陈海伦之前的工作已经从发音学特征的角度度量了声母和韵母的语音差异,但是他采用的方法主要是将发音特征上的差别用成对的区别特征来量化,其划分不能细致准确地剖画语音的差异。本文则采用了语言学教材中更加详细的发音特征划分,并对每个发音特征赋予相应的数值,由此可以用一个多维向量来表征每一个汉字在特定方言中的发音。基于该量化模型,可以计算同一个字在不同方言中的语音差异。最后以《汉语官话方言研究》(11)中的语料数据为基础,计算了基于1026个汉字在42个代表点之间的语音差异,得到了与现有方言分区较为一致的结果,间接验证了模型的合理性。 二、汉字语音特征的量化及方言语音差异 现代汉语中将一个汉字音节分为声母、韵母和声调三部分,汉语方言的语音特征就体现在这三部分上。下面从发音学特征的角度来量化声母和韵母的语音特征。 1.声母的发音特征 声母是汉字音节中开头的辅音部分,也有些音节的开头没有辅音,也就是零声母。辅音是指气流在口腔或咽头受到阻碍而发出的声音,不同的辅音靠不同的阻碍部位和不同的阻碍方法发出不同的声间,因此发音部位和发音方法就是区分辅音的主要因素⑧。 发音部位指发音时气流受到阻碍的部位,包括主动发音器官和被动发音器官,从唇到喉大致分为12种。我们把0~1平均分成12份,并对发音部位从前到后按顺序赋值,保证了发音部位相差不远的音素,其特征值相差也不大。发音部位和特征值见表1。