南岛语言是世界上唯一主要分布在岛屿上的语言,包括太平洋各大小岛屿及亚洲大陆东南部的中南半岛和印度洋一些岛屿上的语言。其分布范围东达南美智利的复活节岛,西到东非外海的马达加斯加岛,南达新西兰,北达台湾和夏威夷岛。其东西延伸距离,超过地球圆周的一半。该语系的总人口大约有4亿,绝大多数居住在东南亚。中国台湾的大多数语言属南岛语,海南岛上的辉辉语属南岛语的占语支。南岛语言内部结构复杂,它包括许多相似而又有紧密发生学关系的语言,还存在大量方言连续区域,因此很难给这些语言划一明确分界线。 1.前科学时期的南岛语言谱系分类研究 航海者从他们游历的地方收集词汇表是很平常的事。第一个南岛语词汇表是意大利编年史学家Pigafetta于1519-1522年首次环绕地球航行至麦哲伦海峡时收集的。荷兰航海家们在穿过马达加斯加向东印度公司航行时也记录有词汇表。荷兰学者Reland首先意识到远距离南岛语言间有发生学关系。1706年他曾假定有一种叫“马来语”的语言从马达加斯加穿过爪哇、婆罗洲和马鲁古群岛,一直向东。2004年有一个编年史学家Anderson发现Cook船长第二次出航时注意到波利尼西亚语和印度尼西亚语、马达加斯加语数词间的相似(Cook 1777)。
(1996[1778])同样使用Cook的语言学证据证明南岛语言的迁移现象。 然而真正系统地建立“马来-波利尼西亚语系假说”(以下简称马-波语)的学者应该是西班牙耶稣会士Panduro。1787年他把大量语言囊括进他的五卷本著作《宇宙观》里。基于当时可得到的所有证据,他认为太平洋地带远至复活节岛的语言与马达加斯加岛、马来半岛、巽他群岛、马鲁古群岛和菲律宾群岛的语言同源。1800年,他又出版了《语言目录》,继续论证马来语和波利尼西亚语之间的发生学关系。 19世纪的学者们进一步巩固这个观点。Raffles(1817)的《爪哇历史》包括马来半岛、爪哇、巽他、马都拉、巴厘岛和楠榜等地语言的词汇。1834年,英国历史学家Marsden写了一篇有关“波利尼西亚语或东部岛屿语言”的论文,文中他创立了二元划分法,把印度尼西亚群岛的语言称为“近处波利尼西亚语”,太平洋一带的语言称为“远处波利尼西亚语”。 1838年德国哲学家和语言学家Humboldt首次使用科学的证据,在他的鸿篇巨著《论爪哇岛上的卡维语》(1836-1839)里仔细研究了马来半岛和波利尼西亚一带9种语言的词汇表。他一方面证明爪哇语、马来语和马达加斯加语之间的关系,同时证明这几种语言与波利尼西亚语的关系。他首次把这些语言置于“马-波语系”之下。 Humboldt处于一个历史上的转折点,即从发现时代到早期分析时代的过渡时期。他在《卡维语》里主要讨论了古爪哇语和南岛语比较语言学,语言与人类精神的关系。在1800多页的文章里他完整分析了那个时代所能得到的有关南岛语言的所有资料,包括Raffles,Marsden以及Crawfurd的研究成果。同时还有马来语、他加禄语和波利尼西亚语的资料。在跨语言比较时Humboldt(像他同时代印欧语专家们那样)对有规律的语音变化不太敏感。他引用的许多词源都存在循环对应,如马达加斯加语h与其他语言k的对应,或者马达加斯加语f与其他语言p的对应等,他把这些都归于模糊的语音相似,认为它们可能在历史上同源。 毫无疑问,在当时那个时代,在多个领域里,Humboldt几乎成了学术界的里程碑。然而,对于南岛语言的比较研究,很公平地说,他只是站在科学时代的最边缘,还没有踏进去。虽然有关语言与思想关系的哲学讨论使他走在时代的最前面,但他的语言研究在多方面与早他130年的Reland不相上下。 在Humboldt发表《卡维语》之后约20年,另一位德国语言学家von der Gabelentz于1861-1873年间出版了大量影响广泛的关于美拉尼西亚语言的著作。Gabelentz大多利用过去20年来社会上传播的学校初级读本、经文和宗教小册子的译本,创建了10种语言完善丰富的语音、语法框架。他的主要目的是为了确认“美拉尼西亚”语言是否存在发生学关系。不过Gabelentz认为美拉尼西亚大多数语言是南岛语。这个结论主要根据语法相似,特别是代词和所有格结构的相似。虽然Gabelentz对比较语音轻描淡写,但他(1861:69)注意到阿内蒂乌语和斐济语的不同在于阿内蒂乌语存在首元音,并且对应一些同源词的零首音,如epeg:bogi(
)“夜晚”,etmai:tama“父亲”。然而,他在建立语音规则对应方面并未走多远(内含一些错误词源如ateuc:tico)。Gabelentz为了比较方便也引用了“马来语”和波利尼西亚语例子,如,斐济语
、波利尼西亚语
、马来语
(天空)。尽管Gabelentz识别了一些正确的同源词,但他并没有把这些同源词放在“马-波语系”里,如同后来的Kern(1833-1917)。