一、短时记忆对语言结构的限制 短时记忆和注意力的限度是一个重要的心理学常数。根据“主干成分分析法”(陆丙甫,1981)或“直系成分分析法”(陆丙甫,2008),任何语言结构都能切分成不超过“七左右”的主干成分或直系成分(核心及其从属语)。 据董振东(1980)介绍,他在研发英中机译系统(即后来的译星)时,遇到一个问题,每个父节点下的子节点可以有多少。当时他随机地规定了不得超过6个,加上父节点自身共7个。董振东后来发现(个人交流),该系统在近10年的考核中,测试了真实文本中的上万个句子,从来没有遇到子节点有溢出6个的,除非是分析出错了。 关于语言结构的切分,是一种静态的分析。陆丙甫(1986)进一步指出,理解句子的“组块”(chunking)动态过程中,任何时刻脑子中所记住的离散块数量也不会超过七块左右。 事实上,静态切分和动态组块虽然本质不同,但有密切联系。 二者都受到短时记忆限度的制约,但是具体内容不同。在静态的分析过程中,分出来的都是句子的直系成分。在动态的组合过程中,进入计算的单位不必都是直系成分,而是广义的离散块。直系成分都是离散块,而离散块不一定是直系成分。因此,我们能从离散块不能超过七块左右,即所有组合的瞬间都不能超过七块左右,推理出静态的结构成分也不能超过七块左右。换言之,可以从离散块不能超过七块左右,推导出直系成分也不能超过七块左右,既然直系成分都是离散块。 静态切分出来的结构,也就是动态组块过程中即将结束的那一时刻的结构。因此,静态切分的限度其实可以由动态组合的限度推导出来。 也可以换一个角度说,静态的结构模式又是对动态过程提炼的结果,或者说,是短时记忆限度对动态处理的限制的语法化。动态组块过程要运用到静态的结构模式:只有那些符合静态结构模式的离散块的排列才能组成一块。近年来心理学界提出“四左右”(4±1)也是一个具有重要心理学意义的数字,它代表了人类信息处理时“关注”(focal attention)范围的限制(见Cowan,2000的总结)。 本文在以往关于“七左右”对人类语言结构影响的研究基础上,进行一些补充并具体分析“四”对人类语言结构和语言理解过程的影响。 二、语言单位结构难度的具体计算 2.1同步组块和结构难度 我们不妨采用“瞬时块数”和“平均块数”两个指标去衡量句子结构体的“结构难度”,即处理难度或感知难度(陆丙甫,1993:190-193)。 “瞬时块数”(instant chunk number,ICN)指某一瞬间脑子中记住的离散句法单位(不包括暂时没有赋予意义的音节)的块数。瞬时块数不会超过七块左右。“平均块数”(mean chunk number,MCN)是平均每一时刻(每处理一个新单位时)脑子中记住的离散句法块数。我们认为MCN是衡量句子结构难度的最基本标准。 下面(1a)是一个以语素为基本单位去计算瞬时块数和平均块数的例子。 (1)a. 我们今天下午讨论语法问题。 ICN:1 1 2 2 3 2 3 3 4 4 5 1 MCN=(1+1 +2+2+3+2+3+3+4+4+5+1)/12=2.58 b. 我们今天下午讨论语法问题。 ICN: 122341 MCN=(1+2+2+3+4+1)/6=2.17 事实上,上面(1a)所描述的那种组块过程还可以简化。我们并不是听完一个音节就处理的,也不是听完一个语素就处理的,实际理解过程很可能是每听完一个“韵律词”(冯胜利,2001)或一个“音步”才进行组块的。也就是说,听到“下”的时候我们通常不会去考虑它的意义,而只是把它当作一个暂时没有赋予意义的音节去记忆的(所谓“回声记忆”)。根据“选择性干扰”(selective interference)的道理,可以把对音节的处理跟句法成分的处理分开来。所谓“选择性干扰”,就是说同时执行两项任务时,两项任务的性质越相似,互相干扰越大。而执行不同的任务,则干扰比较小。如我们可以一边做作业一边听歌曲,但是同时听两首歌曲或做两门功课就很困难。同样,处理音节内部、词内部的结构时,对处理句法结构干扰不大。因此我们可以用“词”为基本单位去计算脑子中记住的板块数目。 在句子理解领域,一般都认为我们大脑里有一个语音—词汇处理机制,还有一个句子处理机制(Frazier et al.,1993);当我们读到一个字(如“下”),我们一般把它放在语音—词汇处理器里面,然后继续读下面的字(如“午”),并在词汇处理器里把这两个字组成一个词,提交到句子处理器里进行组块。当然,将一部分组块工作放到语音—词汇处理机制去处理,不是说词汇处理对整个处理的负担没有影响。事实上,两个过程肯定是互动的,而表达这种互动关系的方法之一是数量转换,如计算出词汇处理难度对句子处理难度的影响大小。由于我们暂时不知道短时记忆跟语音—词汇处理的关系,可以暂时把词汇处理过程忽略不计。