日本列岛位处亚洲大陆东部,由北海道、本州、四国、九州四个大岛和7200多个小岛构成。最北端是北海道,北海道两侧是库页岛和千岛群岛;最南端是琉球群岛,这些岛屿一直延伸到台湾。北海道和琉球群岛上的土著居民被称为阿伊努人和琉球人,其他被称为本土日本人。①日语即居住在日本列岛上的日本人所说的语言,一般认为包括本土诸方言和琉球诸方言,细致划分则有北海道方言、关东方言、近畿方言、四国方言、肥筑方言、奄美方言等数十种。②(见下页图1) 近年来,伴随着演化语言学的发展,语言演化网的生成已经成为解释语言之间和语言内部关系的重要方式。Saitou N.et al(2017)使用语言演化网清晰地展现出日语的内部语言关系。虽然琉球诸方言与日本其他方言在演化网上有相对距离,并且分化方式也不大相同,但琉球语和日语已经凭借规则的音声对应,以及句法和词汇等证据,被认为是日语方言的一种,只不过分化年代较为久远。③④目前,日语拥有一亿以上的使用者。无论从使用者的人数来看,还是从语言的综合影响力来看,日语都能在世界语言排名中占据前列。由于日本列岛地处欧亚大陆的边缘,长期地理环境的隔离使日语的形成和演化呈现出不同于一般语言的复杂性和典型性,日语的起源及系统论即谱系划分一直是语言学界争论的焦点问题之一。同时,日本人群的起源和混合历史也是极具争议性的热点话题之一。随着高通量基因芯片分型和测序技术的发展,国际人类基因组单体型图计划(HapMap)、“太平洋地区人类基因组织泛亚洲单核酸多态性计划”(HUGO Pacific Pan-Asian SNP Initiative)、千人基因组计划(1000 Genomes Project)等项目发布了大量日本人的遗传数据,再加上从古人遗骸中提取的古DNA数据等的分析,我们更清楚地了解日本各族群的起源与混合历史。本文拟采用语言学和分子人类学相结合的研究方法,力求更科学、更客观地展示日语语言多样性与日本人群迁徙和混合的相关性,从而为日语的起源及系统论研究提供新的研究视角和思维模式。
二、日语的源流和接触混合 长期以来,日语的源流问题受到了日本国语学家和世界语言学家的关注。学者们从历史语言学、比较语言学和语言类型学的角度对日语和其他疑似亲属语言做了深度解说,对日语源流问题有了深刻的认识。根据小泉保(2013)对日语起源的最新论说,参考龟井孝(1973)、村山七郎(1973)、安本美典(1978)、大野晋(1994)等对日语与疑似亲属语言的系统比较研究,把日语起源分为同源论、重层论及岛内生成论。⑤ (一)同源论 同源论即认为日语与其他语言的同一起源论,也就是承认二者在同一谱系下的亲属关系。日语的同源假说大体可以分为北方说和南方说两类。北方说包括朝鲜语、蒙古语、满语、土耳其语、芬兰语、匈牙利语;南方说包括南岛语、泰米尔语、高棉语、藏缅语。 日语与朝鲜语(韩语)的同源说自日本明治时代以来就广为传播,这与日本对朝鲜半岛的殖民统治有一定的关系。不过二者确实有一致的语法规则、有近似词汇、历史上也都有过元音和谐现象,⑥但在现代语音上呈现出“复合对应”的模式,如日语的“-ti”对应朝鲜语的“-t、-l”,朝鲜语的“-t”对应日语的“-ti、-du”等。⑦另外,有学者构拟过日语与蒙古语、通古斯语族中的满语之间的亲缘关系,它们也存在复合对应或者偶然对应的语音形式。日语和土耳其语、日语和芬兰语、日语和匈牙利语的比较研究主要依据是元音和谐现象。据此Robbeets M.(2018)甚至提出了包括日语、朝鲜语、阿尔泰诸语言在内的泛欧亚语言说。⑧ 在日语的同源假说南方说中,主要有南岛语、泰米尔语、藏缅语和高棉语。有学者认为这些南岛语是日语成立的基础,如日语的开音节结构起源于波利尼西亚,身体相关词汇和印度尼西亚语类似,并且都是高低型音调,从而认为日语与其具有同源性。Labbe是ton D.V.H.举例分析了日语的“ki(木)”对应马来语的“kaju”、日语的“uwo(魚)”对应爪哇语的“iwak”等;藤原明对比了日语和南印度以及斯里兰卡东北部使用的达罗毗荼语系泰米尔语,如日语的“atsi(足)、
、tsika(鹿)”分别对应泰米尔语的“ati、*kutil、*cinkay”;Parker C.K.认为日语与藏缅语的多数语言同为SOV语序,并有音声对应关系,如日语的“asa(朝)”对应纳加语的“asang”;日语的“tuma(妻)”对应西藏语的“a-dun-ma”等。⑨ 另外,日语也有南亚语起源说,安本美典(1978)就认为高棉语和印度尼西亚语在六七千年以前伴随杂谷培植技术传入日本。日本《古事记》、《日本书纪》中的“kume(久米族)”指的就是“khmer(高棉族)”,日语的“kome(米)”也来源于该词。在语言同源关系的判定中,音声对应起着重要作用。但上述学者们的证据都是个别语音、词汇的对应,没办法系统地进行整体对应模式研究。如日语跟朝鲜语、蒙古语、通古斯语以及泰米尔语的音声比较中都出现了无法解释语音演变过程的复合对应形式,日本的朝鲜语学者河野六郎认为,不应该为了证实日语和朝鲜语的亲属关系而勉强进行音声对应的努力;⑩南岛语接头词很多,而日语正相反,接尾词远远多于接头词;泰米尔语的名词有男性、女性、中性的区分,并且有单复数区分以及格变化,这些又与日语有根本不同。(11)因此,日语和这些语言有相似的成分,也许来自于同一始祖语言、也许来自于接触混合,但是说同源就未免太绝对了。