1.语言“共性度”及“差异度”的量化 人类语言究竟是以共性为主还是个性(差异性)为主?这个问题如果不量化,恐怕是永远不会有结论的。 句法结构的难度就可以量化。我们平时理解语言的过程并不是听完或看完一个句子再来分析、理解的,而是边接受边“组块”(chunking)的过程[13]。在这个过程中,由于短时记忆的限制,任何时刻能够记住的离散结构块不可能超过七块左右(7±2)。因此,组成句子的结构块不可能超过七块左右。这是人类语言结构最基本、最明确的共性。 其次,由于大脑对焦点信息感受的限制,任何语言的任何句子中,不可缺少的句型成分(如动词加上必有论元)都不会超过四块[18]。如双宾语句有四个句型成分“主语、动词、直接宾语、间接宾语”。致使句也有四个句型成分“主语、动词、宾语、宾补”。 上面所说的“结构块”,也就是“语序单位”。由此可见,语序研究是可以定量化的。下面我们就进一步用语序变化来说明语言共性和个性的关系。 假设若干成分,数学上容许的排列是100种,并且事实上所有这100种排列在语言中都存在,我们就说这些成分组成的排列是100%自由的,即享有100%的语序变化“自由度”。如果实际存在的排列只有50种,我们就说“自由度”和“共性度”(或“限制度”)是一半对一半,即自由度为50%,限制度也是50%。假如100种数学上可能的语序中,实际存在的只有20种,那么,差异度是20%,共性度是80%①。这样,我们就得到下面三个计算公式: a.差异度+共性度=100% b.差异度=实际上可能存在的形式的数量/数学上可能的形式的数量 c.共性度=实际上不可能存在的形式的数量/数学上可能的形式的数量 “共性度”(universality degree)也就是“共性指数”(universality indicator)。 现在我们来分析具体的例子。 把一个句子,去掉主语、宾语,如果还有“时位(T)、时量(D)、处所(L)、工具(I)、方式(M)”和动词核心这样6个成分②,数学上的排列应该是6x5x4x3x2=720种可能。但实际上可能的排列要少得多,我们目前只发现以下6种(俄语中第5和6两种顺序都很常用)。当然,这里列出的那些序列是指“无标记”语序,即语用上最中性的、通常也是使用上最少条件限制的语序。
下面列举若干代表每种顺序的语言。 1)日语、朝鲜语、巴斯克语 2)汉语 3)塔卡碌语 4)希伯来语 5)拉脱维亚语 6)英语、法语、葡萄牙语、越南语、约罗巴语 汉语:(他)[上星期[[在实验室[用计算机[连续地[工作了]]]]三天]] 英语:(He)[[[[[[worked]continually]with computers]in the lab]for three days]last week] 根据上述语序可以发现一个以动词为核心的共同的轨层结构。这个轨层是由各状语跟动词的语义紧密度决定的。由最高的I到最低的V所组成的这个垂直序列可看做基础形式,上述六种排列都是同一个基础形式的具体落实形式。由此可见个性是共性的具体落实形式而已。由于这个轨层的限制,这6个成分所容许的可能语序就从720种急剧下降到2x2x2x2x2=32种(作为某种语言中无标记的基本语序)。在数学上可能的720个排列中,人类语言只选择了32种,而排除了688种。这样,我们可以说这些成分组成的语序,差异度是32/720=4.4%,而共性度是95.6%。可见人类语言的共性程度,至少在语序方面,远远超过差异程度。 实际上调查得到的序列还远远达不到32种,看来除了轨层的限制外,还受到其他一些限制。如果我们看时位T、时量D和动词V的情况,可以发现符合轨层限制的四种排列中,有三种是存在的,即1、3、4中的[T-D-V]“上星期-三天-工作了”,2、5中的[T-V-D]“上星期-工作了-三天”和6中的[V-D-T]“工作了-三天-上星期”,就是没有[D-V-T]“三天-工作了-上星期”。假设[D-V-T]因为某种原因而不可能存在,那么,就又有8种包含[D-V-T]的排列又被排除了。于是可能的语序又进一步从32降低到24种,而“自由度”也下降为24/720=3.3%,这意味着共性度上升为96.7%。 本文以下第二节就深入讨论[D-V-T]排列不可能存在的原因。大致说来,T跟D之间有“整体—部分”的关系。“整体在先,部分在后”是人类语言的无标记顺序,相反的顺序,即“部分—整体”顺序是有标记顺序,在一定的条件下才能够存在。[D-V-T]顺序是有标记顺序,但是并不满足“部分—整体”得以存在的条件,因此无法存在。 在此分析的基础上,本文后面各节将进一步考察“整体—部分”优势顺序的扩大和引申,证明这一优势语序对人类语言结构的多方面影响和普遍意义,是人类语言的重要共性之一。