现代人走出非洲[1-3],人类语言也随之扩散到世界各地。经历数万年,不同地区的人群形成各自的文明,也形成了多样性的语言。语言的多样性反映了演化的复杂性,但犹如生物自简单而复杂,语言亦非生而复杂。历史语言学证明,几乎所有复杂的词法形态和句法现象都是逐步产生的[4-6]。但早期口语一定包含了人类语言作为区别于其他生物交流方式的符号系统所拥有的基本结构,并清晰地外显。这种结构经历数万年多样性演化也不会丧失,而会在现代语言中传承下来,这就是我们称为语言“基因”的词形结构或词音节结构(word-syllable structure)。词形结构的多样性或差异性决定了语言的类型和面貌,是观察现代语言分类和追溯语言历史渊源的最重要要素,也是追踪人类族群迁徙和地理分布的参照线索。 1 什么是词形结构 词形结构是词义的语音形式和形式的结构,由音节和组成音节的音素构成。它不是一种元音或辅音这样的个体音素形式,而是一种结构体。结构体的表达是把词的具体的音素(如a,b,m)抽象为音类C,V(C表示辅音,V表示元音)并以音类符号的排列结构来表达,例如英语词sesame[
]由6个音素构成3个音节组织而成,即CV·CV·CV。本文约定,词形结构有时候可以简称结构,例如CV结构,形态则指音类符号排序的各种形式。关于音节,近年来学者们有一项极为重要的发现,他们认为CV结构是人类语言偏好形式或基本形式[7-12]。不过,尽管这个结论来自心理实验、行为实验、语言习得、生成音系学等多个领域,从真实词形中抽取的单个CV形式却没有语言单位价值,唯有整体词形才符合词的音义结合的本质。由此,我们推论人类语言词形结构的初始形态很可能是
,其中当然也包含了单一CV词的结构。
人类早期在世界的活动主要呈现为迁徙模式,随着人口增长逐步扩散到世界各地。如果现代人曾拥有相同的初始语言[5],词形结构也应具有一致的初始形态,正是数万年的迁徙扩散、人群的隔绝和语言的随机演化导致了词形结构的地理区域差异,造成词形结构在世界范围内呈现出高度复杂性和多样性。 2 词形结构进化的历史深度 Atkinson[14]曾以音素作为人类语言基因要素探索人类起源于非洲的命题,这种思想有着深刻的学术背景[15]。全球人类基因组创始人Cavaili-Sforza等人[16]认为语言进化与基因进化具有平行性,现存的大约5000种语言与今天的民族和土著部落相当吻合。甚至进化论奠基人达尔文也提出“假如我们拥有一个完善的人类系谱,则人种排列成的系谱将能提供现在整个世界上所说的各种语言的最好分类”[17]。不过,Atkinson[14]采用的音素和音素数量并不是语言中稳定的参项,语言不断发生音素变化,从一种音素变为另一种音素,例如b→B,k→x,也经常失去原有音素,或产生新的音素,音素和音素数量在一代代人之间变化传承,累积起来足以使一个语言的音素系统面貌全非。历史语言学家Campbell[18]指出:由于跨越如此漫长的年代,发生如此巨大的变化,原初语言没有任何东西以任何形式在现代语言里残留下来。Campbell的观点有点片面,个体音素的确不停地变化,词形结构也会变化,但任何语言都保持着动态稳定的音系、词汇[19]和基本词形结构,语言交流功能不会中断。迄今,语言描写和类型研究告诉我们,任何语言都没有所有词形变为
或者
这类结构,也没有所有词都以V起始的语言,没有所有词都以C结束的语言[20],
结构仍然是人类语言的基本形式。 上文推论人类语言词形结构具多音节性,其中蕴含了语言起源的单源性假说。这个假说基于语音变化的原理和规则:所有语言普遍发生语音弱化和脱落,反之,增音(音素)则是随机的、临场的和语流音变性的。换句话说,语言伊始呈现多音节词面貌,经过脱落,词长逐渐缩短,形态复杂度逐渐增加。这个观点跟20世纪早期Jespersen[21]的观点一致,他认为语言是从原始多音节词朝单音节词发展。Jackendoff[5]对人属(包括尼安德特人)的发声音姿单位提出一个有趣的描述:每个音节都是一个整体发声音姿,用10个这样的音姿,人们就能建立100个双音节原始音节发声串和1000个三音节的原始音节发声串,这种方法很好地实现了开音节结尾。Jackendoff所说“整体发声音姿”即音节,他所描述的开音节表明音节形式就是CV,然后可以组成双音节词CVCV或更多音节的词。