语言的起源是研究语言的一个中心问题,也是研究人类的一个中心问题。因为人类最显著的特点就是有语言。没有别的动物发明过语言,也没有其他的动物学得会一个完整的语言。我们可以认为,研究语言的起源,是研究现代人的起源的一个最重要的部分。研究人类的起源,与研究语言的产生是密不可分的。 过去的一百多年里,考古工作已经发掘出很多古人的化石。如中国周口店发现的北京猿人,还有据考察距今二十万年的大荔人。原来人们认为我们就是这些古人的后代。可是近年来随着研究的深入,考古学家们认为这些古人不可能都是现在生活在地球上的人类的真正的祖先。如我们从动物的演化史知道的,很多动物的物种都没能通过代代相传保留到现在,他们在演化的过程中被淘汰掉了。这个论断从基因学的研究成果中可以得到支持。 基因研究是我们追溯人类的起源的一个非常有力的工具。关于现代人的祖先,这方面的工作也许可以从Cann等人1987年的一篇文章(注:Rebecca L.Cann,Mark Stoneking & Allan C.Wilson,1987.Mitochondrial DNA and human evolution.Nature,325,31-6.)算起。他们采用母系传递的线粒体DNA(MtDNA)材料进行研究,他们得到一个谱系树,发现最早的分支是非洲人种与其他地方的人种分开。这个研究给出的结论是现代人的祖先,即智人(Homo sapiens),是从非洲迁徙到世界各地的。他们认为人类最近的共同老祖宗可能生活在十至二十万年以前。 Cann等人的成果给研究人类的起源带来了很大的推动。近一二十年,人类基因学进展神速,几乎可以说是日新月异。值得一提的是最近的一个报告,2000年6月发表在美国科学院学报的一篇论文,(注:R.Thomson,J.K.Pritchard,P.Shen,P.J.Oefner and M.W.Feldman,2000.Recent common ancestry of human Y chromosomes:evidence from DNA sequence data.Proc.Nat.Acad,Sci.,97.7360-7365.)他们采用的材料是父系传递的Y型染色体,得到一个比Cann等人推算的更近的时间,他们认为人类最近的共同老祖宗距离我们只有五万多年。 这个最新的结论跟考古学家的一些已有的发现和推论非常吻合。考古学家们认为在五万年前,在人类文明演化的过程中出现一些很重要的里程碑,例如一些山洞里的壁画,埋葬死人的坟墓以及墓里陪葬的花草。从这些可以认为那时的古人已经有了艺术和宗教的萌芽。(注:Richard G.Klein,1999.The Human Career:Human Biological and Cultural Origins(second edition).The University of Chicago Press.)同时大约在五万年前,有证据证明人类第一次在航海的技术上有了突破,能从亚洲的南部迁徙到澳大利亚。所以基因学在发现人类最近的共同老祖宗距离我们大约五万年,而考古学也同样有很多证据证明那是个重要的时期,那时的人类在文明上已经有了一些很显著的突破。 是什么原因使一些古人在那个时候有了这些突破而有个大跃进呢?我们猜想那些古人能发达到那个程度,最主要的原因是他们发明了语言。语言能帮助他们开始有系统的、复杂的、抽象的思维;语言能使一群人团结起来,互相沟通,传递知识,积累知识。一些个人无法做到的事情可以通过语言的沟通进行有效的组织而成为可能。 那么“语言”这个奇物到底是怎样发生的呢?它是在一个地方起源然后逐渐散播到其他地方去的,还是同时在世界几个地方由不同的人群分别发明的呢?以前语言学家一般的看法认为语言是单源发生的。他们觉得语言是这样一个复杂而深奥的东西,发明语言一次已经是需要很大的巧合了,要能被发明几次,这个可能性则一定是很小很小的了。可是我们认为这个想法有两个基本的错误:一个是当代的语言的确非常复杂,每个语言都有成千上万的词和一些极为奥妙的结构。可是这些应该是几万年演化的结果。我们可以想象得到,最实际的原始语言,一定是非常简单的。而后来由于各种需要逐步逐步变得越来越复杂了(请参看Schoenemann 1999(注:P.Thomas Schoenemann,1999.Syntax as an emergent characteristic of the evolution of semantic complexity.Minds and Machines,9.309-346.))。就像数学的开始也只不过是发明数字来数东西而已,而当代的数学却是奥妙无比了,单源说的另一个错误可以从概率上分析。我们认为单源说忽略了一个很重要的变数。我们知道,五万年前一定有很多人群,很可能有成千上万的不同人群。即使我们假设语言在一个地方产生的概率很小,但如果人群的数目足够多,我们可以用概率模型来证明多源说的发生可能性会比单源说的可能性大(详细的证明请参看(注:David A.Freedman & William S-Y.Wang,1996.Language polygenesis:a probabilistic model.Anthropological Science,104.2.131.138.))。 五万年这个时间距离在我们讨论语言的起源上还有一个重要的意义。近年来,很多语言学家把语言起源看作一种基因突变的结果。在文献中我们常常能看到诸如语言器官(language organ),语言生物程序(language biogram),语言本能(language instinct)等等的字眼。很明显,我们说话时需要有呼吸和听觉等器官,我们的词汇需要记忆,我们造句的时候需要有种种分析和组合的能力。可是这些不同的能力是建立在生命的最基本的材料上以适应最基本的生存的需要的,不可能是为了要产生语言而从基因变异特殊地演化出来的。而且,因为生物演化往往是要经过几百万或几千万年才能起作用的,所以语言是绝对不可能在短短的五万年以生物演化的形式由基因突变而来(这个观点的详细阐述见王士元曾发表于1978在印度海德堡的一个演讲,后收录于(注:William S-Y.Wang,1996.Explorations in Language.105-131.Taiei:Pyramid Press.))。