1.引言 屯堡是明朝定点防御、城防体系的基层组织名称。“屯堡人”则是对生活在贵州省中部地区安顺市平坝县天龙镇、西秀区大西桥镇、七眼桥镇等屯堡村寨人们的称呼。自1902年日本学者鸟居龙藏走进天龙镇屯堡村寨作考察以来,这群自称是明洪武年间调北征南而来的南京周边屯军移民后裔便受到极大关注。鸟居龙藏(1907/2019:445)认为他们“将江南地方的耕作方式引进到贵州,继续保留着祖先的遗风”。此后,“屯堡”成为人类学、文化学、历史学、建筑学等众多学科的重要研究对象。相较之下,屯堡语言研究略显薄弱。目前主要研究内容有:对音系、词汇进行共时描写或历时比较;通过语音特征分析人口历史来源及文化成因(伍安东、吕燕平,2004;吴伟军,2007、2011、2014;龙异腾等,2011;曾晓渝,2021;石绍浪,2022)。整体而言,屯堡话依旧保留着一些与周边汉语方言或少数民族语言不同的语言特征。在语音上主要表现为“清入声、次浊入声归阴平调,声母分平翘舌”(曾晓渝,2021:180),阴平调的调值为33,这与屯堡周边安顺、贵阳地区的阴平调值55不同,应是明代汉族移民方言的底层(吴伟军,2014:103-104)。而在词法和句法上,屯堡话与周边的汉语方言相似程度很高。 在贵州省西南官话的影响下,屯堡话为何始终保持着较为鲜明的语音特点?这引起了学者们极大的兴趣,相继从不同研究视角分析屯堡话的来源。目前,关于屯堡话主体来源主要有以下几种观点:1)来自明代南京(南直隶)地区,持这类观点的学者最多。伍安东、吕燕平(2004)对比屯堡话与其他4种汉语方言,认为屯堡话源自巢湖附近。万明(2005)根据民俗习惯,结合史料和族谱信息,推断屯堡人的来源与古徽州地区密切相关。龙异腾等(2011)结合历史材料及族谱分析,认为屯堡人的先祖是明洪武年间入黔,主体来自明代南京(南直隶),具体为现今江苏省、安徽省、江西省和上海市。曾晓渝(2021)将屯堡话语音系统与相关方言进行比对,认为屯堡话与中原官话有着很密切的渊源关系,屯堡人祖先的主体很有可能来自南直隶地区的中原官话州县及河南的一些州县,并指出屯堡话内部最具影响力的是中原官话。2)来自明代江南地区(蒋立松,2004)。3)来自鄱阳湖为中心的湖北省、江西省一带。吴伟军(2014)从屯堡方言语音的历史层次来看,推测屯堡人族群来源地是今湖北东部、江西北部、鄱阳湖周边一带。另有一种观点结合了前面三种说法,认为屯堡移民来自安徽、江苏、江西、湖北等地(袁本良,2006)。4)来自陇中南地区,大致相当于如今甘肃省定西市到天水市一带。石绍浪(2022)比较方音特点并结合历史材料,推测屯堡移民主体来自陇中南,以原珉州卫军民的可能性最大。5)来自北方民族地区。陈训明(2002、2008)认为屯堡主体居民祖先系洪武年间被带往西南地区的前元太尉纳哈出的部属,以及与之婚配的当地土著。文章提及铁岭大部分地区曾是哈纳出的属地,铁岭和屯堡地区的地名中均集中出现类似的卫所制度遗留词汇,认为两地移民主体之间具有内在联系。 关于屯堡话主体来源,现有研究主要从语音系统比较、常用词汇分析、历史材料溯源、文化信仰对比等方面进行推测和考证,至今尚未达成共识。众所周知,语言是文化的重要载体,移民和接触造成的语言变化都可以通过分析语言内部系统差异而找到相应的线索。因此,我们采用ASJP模式的距离计算方法,对屯堡话及相关汉语方言的语言距离和地理距离进行计算,并进一步探讨它们之间的语言关系,为屯堡话历史来源提供一个新视角下的佐证分析。 2.材料与方法 基于现有推测历史来源的相关研究材料,我们运用ASJP模式的距离计算方法,对屯堡话及相关方言进行语言相似度、语言距离及地理距离的计算。首先对文章运用的计算方法和材料进行说明。 2.1 ASJP模式的距离计算 ASJP项目是欧洲马克斯-普朗克研究所开发的一个致力于为语言提供客观距离计算、对世界范围内的语言实现自动分类的科研项目。ASJP(Automated Similarity Judgment Program,相似性自动判断程序)是ASJP项目的核心程序,该程序可以对数据库中的语言材料进行自动编辑距离计算,并在此基础上判断语言的相似性,从而实现语言自动分类及其他更进一步的语言研究。第20版ASJP数据库收集了世界范围内10168个“语档(doculect)”,根据ISO639-3编码,该语档涉及世界范围内的5590种语言。ASJP模式计算程序的步骤是:首先,将需要计算的语言实现从国际音标到ASJP码的转写。需要说明的是,ASJP模式下的音标转码过程是研究者开发的音位化过程,而非直接采用国际音标进行计算。其次,用莱文斯坦编辑距离(Levenshtein Distance,简称LD)对语档材料进行语言距离计算。Wichmann等(2010)分析比较了归一化编辑距离(LDN)和归一化编辑距离商(LDND)算法在进行语言距离计算时的性能,目前较为常用的算法是LDND算法。再次,分析语言距离计算结果或将距离数据转换为相似度数据,语言相似度公式为1-LDND%(Wichmann等,2010)。 ASJP模式距离计算的语言材料为斯瓦迪士100核心词,该词表在以印欧语为代表的多种语言研究中已得到较为充分的验证,能切实有效地进行语言研究。众多国内外学者将它用于汉藏语系研究中(可参看徐通锵,1991;Wang,1995;陈保亚,1996、2006;孙宏开等,2007),也有学者尝试对该词表进行本土化改造。经过实践验证,以斯瓦迪士100词表为语言材料进行语言关系研究的效果是比较理想的。邓晓华、王士元(2003:254-255)认为,斯瓦迪士100核心词表具有可比性、国际性和可计量性原则。前文提到,ASJP程序的核心计算方法是编辑距离计算,与传统的历史比较法、语音比较法相比,是一种可实现快速计算的计量化方法;与其他计量方法如词源统计法、特征赋值距离计算相比,是一种可实现快速量化分析语言关系的方法。ASJP模式距离计算方法被应用于包括历时层面的语言亲缘关系(赵志靖、江荻,2018)、共时层面的语言分类(江荻,2022)、语言分化时间和变化速率(Holman等,2011;冉启斌,2020)、语言差异和地理空间的交互关系(原新梅等,2022)等多个研究领域。在本文中,我们采用该方法分析屯堡话及相关方言的语言关系。