语言的计量分析研究作为当今国际语言研究的热门话题,融合了众多学科的优势和技术方法,近几年国际上发表了多篇基于语言大数据的语言起源以及传播研究方面的文章(Dunn et al.2005;Russell et al.2009;Atkinson 2011;Remco et al.2012)。传统语言学的计量研究主要依托研究者的主观经验抽取结构性特征,例如词汇和语法特征,人工反复比对,确定语言间的亲疏、亲缘关系以及其演化模式(Baxter & Ramer 2000;
et al.2013)。由于“大数据”时代的来临,语言学家所能获取的数据量将呈指数性的增加,数据特征之间的关联性将更大,数据中承载的信息量也会更大,传统的语言研究方法需要寻求新的突破。实际上,中国语言学家早已开始进行语言亲疏的计量研究(郑锦全1988;陆致极1992;邓晓华和王士元2009;汪峰2012)。立足于前人的研究基础,本文在研究方法上进一步拓展。 本文采用邻接树、主成分分析方法及高程模拟综合图对闽南方言各代表点的音系材料进行计算,推测闽南方言的传播方向。结合移民史和方言史文献材料,验证计算结果的合理性和可靠性。 2.闽南方言简述 闽南方言是汉语方言闽方言中最大的一片,口音最为一致(侯精一2002:225)。闽南方言发源于中国福建南部,主要分布在福建省南部厦门、泉州、漳州一带,另有台湾省、广东省潮汕地区、雷州半岛以及海南省的部分地区以及海外等(袁家骅2006:237)。 纵观闽南方言的形成,早在唐五代时该方言通行于泉州、漳州所辖地区,包含今天的莆田、仙游和龙岩一带。据《三山志》记载:699年,唐王朝派遣光州固始县(今河南)人陈政、陈元光父子为首的123个将领,南下“征蛮”。这批汉人后来定居于闽南,并开发了漳州。由于地理位置的近便以及本土人口的压力,两宋之后,闽南方言陆续向广东扩展,传播到潮汕平原和雷州半岛,有的登上了海南岛。台湾与福建一水之隔,早在唐宋时漳州沿海一带就有人过海到台湾,明清两代,更有大批的人东渡台湾。所以台湾的闽南方言是由福建泉州漳州两地移民带人的闽南方言(陈碧加1998)。从粤东起至雷州半岛、海南岛讲闽南语的居民,其祖先都是福建移民而来的(林伦伦1995)。所以闽南方言是从闽东南沿海向南北海岸线扩展分布的,向南的主要线路是沿海岸线从潮州、汕头、汕尾到中山、电白(莆田话)、雷州半岛、一直到海南岛全岛(李如龙2008:139)。另外,从闽南方言的移民史判断,“泉州是闽南开发最早的地区,清嘉庆年间出版的地方韵书以泉州音作为标准。漳州话在闽南的地位曾因漳州月港成为闽南外贸中心而提高。鸦片战争以后,厦门话成为当地权威语言。”(游汝杰和邹嘉彦2009:50)可见,闽南语的标准音在历史过程中有所改变。早期闽南方言以泉州话作为标准,梨园戏和南曲作为闽南地区保存较为完好的古老戏曲,至今都是以泉州话作为标准音。随着厦门的发展,厦门在当地的社会地位上升,现成为闽南方言的代表音。 综上所述,学界普遍认为福建南部是闽南方言的中心,闽南方言主要是沿海岸线向南传播。那么如何通过计量分析语音音系系统支持学界关于闽南方言向南传播的传统结论,这是本文研究的重点。 3 材料和方法 本文以音位音系特征为计算对象推测闽南语语言传播模式。其理由如下:音位是语言系统中具有辨义能力的最小语音单位;音位作为组成音系结构的主要元素,具有较强的稳定性和低突变率的特点,例如香港粤语虽然大量借用了英语的字词,但是香港粤语还是保持了粤语固有的音系结构。同样的,越南语、日语和韩语同样大量借用汉语字词,但是这种借用并未侵入它们固有的音系结构中。在音系结构中增加或减少一个音位都会产生较大的结构改变,而且需要较长时间才能达到新的稳定状态,体现了音系结构时变缓慢的特点。 虽然不同的调查人在描述同一种语言的音系系统时可能会存在较大的差异,但该方言的主要区别性特征一定能够被描述出。同一个调查人对不同方言的调查,对方言中的区别性语音现象以及对语音音位的描述也较为一致。 针对音系结构以及调查材料的特点,本文选取闽南方言11个代表点的音系材料。①这11个方言点分别为:泉州、厦门、台中、漳州、汕头、揭阳(榕城)、海丰、雷州遂溪、雷州、文昌、三亚。通过整理归纳出每个方言点的音系结构,并对音系数据进行“0-1”量化编码,“0”表示语言不存在该特征,反之则是“1”。 通过对11个方言点音系材料的总结,确定声母音位特征有30个,主元音特征有9个,入声韵尾特征有4个,“有无鼻化元音”特征1个,总共44个音系特征(部分数据如下表1)。需要注意一点,由于任意两种语言具有的特征并不完全相同,本文选取这两个语言的特征类型的并集作为总特征序列。例如有一种语言
有特征ABC,另一个语言
有特征BCDE。这两种语言共有的特征是B和C,但是特征A、D和E并不是共有的,所以在比较这两种语言特征时,建议选取特征种类的并集,即ABCDE作为总的特征序列。