“组块”与语言结构难度

作 者:

作者简介:
陆丙甫,男,博士,南昌大学教授。研究兴趣为语言类型学、句法学和应用语言学等,著有《核心推导语法》及论文一百多篇(上海市钦州路768弄5号402室200233); 蔡振光,男,爱丁堡大学心理学系博士生,研究兴趣为句子理解、句子产出(Psychology,7 George Square,Edinburgh,EH89JZ,Scotland,UK)。

原文出处:
世界汉语教学

内容提要:

本文根据短时记忆的限度为“七左右”(7±2)以及短时记忆对“四”的敏感这两个心理学基本现象,对一些语言结构现象进行量化的分析和解释。“七左右”代表了处理语言时大脑中能够容纳的离散块数量的最大限度,“四”代表了一个敏感点。初步分析表明,一个句子的处理过程中如果平均每时每刻要记住4个以上的离散板块,句子就会显得累赘。并且,处理者会把需要记住的离散块数量尽量控制在“四”以下,需要记住的离散块如果没有超过四,处理者会倾向采取延迟组块的策略,以避免错误组块;离散块如果超过四,处理者会倾向采取超前组块的策略,以及时减轻大脑负担。组块计算为语言单位结构难度的计量提供了一个普遭适用的基本起点。


期刊代号:H1
分类名称:语言文字学
复印期号:2009 年 04 期

字号:

      一、短时记忆对语言结构的限制

      短时记忆和注意力的限度是一个重要的心理学常数。根据“主干成分分析法”(陆丙甫,1981)或“直系成分分析法”(陆丙甫,2008),任何语言结构都能切分成不超过“七左右”的主干成分或直系成分(核心及其从属语)。

      据董振东(1980)介绍,他在研发英中机译系统(即后来的译星)时,遇到一个问题,每个父节点下的子节点可以有多少。当时他随机地规定了不得超过6个,加上父节点自身共7个。董振东后来发现(个人交流),该系统在近10年的考核中,测试了真实文本中的上万个句子,从来没有遇到子节点有溢出6个的,除非是分析出错了。

      关于语言结构的切分,是一种静态的分析。陆丙甫(1986)进一步指出,理解句子的“组块”(chunking)动态过程中,任何时刻脑子中所记住的离散块数量也不会超过七块左右。

      事实上,静态切分和动态组块虽然本质不同,但有密切联系。

      二者都受到短时记忆限度的制约,但是具体内容不同。在静态的分析过程中,分出来的都是句子的直系成分。在动态的组合过程中,进入计算的单位不必都是直系成分,而是广义的离散块。直系成分都是离散块,而离散块不一定是直系成分。因此,我们能从离散块不能超过七块左右,即所有组合的瞬间都不能超过七块左右,推理出静态的结构成分也不能超过七块左右。换言之,可以从离散块不能超过七块左右,推导出直系成分也不能超过七块左右,既然直系成分都是离散块。

      静态切分出来的结构,也就是动态组块过程中即将结束的那一时刻的结构。因此,静态切分的限度其实可以由动态组合的限度推导出来。

      也可以换一个角度说,静态的结构模式又是对动态过程提炼的结果,或者说,是短时记忆限度对动态处理的限制的语法化。动态组块过程要运用到静态的结构模式:只有那些符合静态结构模式的离散块的排列才能组成一块。近年来心理学界提出“四左右”(4±1)也是一个具有重要心理学意义的数字,它代表了人类信息处理时“关注”(focal attention)范围的限制(见Cowan,2000的总结)。

      本文在以往关于“七左右”对人类语言结构影响的研究基础上,进行一些补充并具体分析“四”对人类语言结构和语言理解过程的影响。

      二、语言单位结构难度的具体计算

      2.1同步组块和结构难度

      我们不妨采用“瞬时块数”和“平均块数”两个指标去衡量句子结构体的“结构难度”,即处理难度或感知难度(陆丙甫,1993:190-193)。

      “瞬时块数”(instant chunk number,ICN)指某一瞬间脑子中记住的离散句法单位(不包括暂时没有赋予意义的音节)的块数。瞬时块数不会超过七块左右。“平均块数”(mean chunk number,MCN)是平均每一时刻(每处理一个新单位时)脑子中记住的离散句法块数。我们认为MCN是衡量句子结构难度的最基本标准。

      下面(1a)是一个以语素为基本单位去计算瞬时块数和平均块数的例子。

      (1)a. 我们今天下午讨论语法问题。

      ICN:1 1 2 2 3 2 3 3 4 4 5 1

      MCN=(1+1 +2+2+3+2+3+3+4+4+5+1)/12=2.58

      b. 我们今天下午讨论语法问题。

      ICN: 122341

      MCN=(1+2+2+3+4+1)/6=2.17

      事实上,上面(1a)所描述的那种组块过程还可以简化。我们并不是听完一个音节就处理的,也不是听完一个语素就处理的,实际理解过程很可能是每听完一个“韵律词”(冯胜利,2001)或一个“音步”才进行组块的。也就是说,听到“下”的时候我们通常不会去考虑它的意义,而只是把它当作一个暂时没有赋予意义的音节去记忆的(所谓“回声记忆”)。根据“选择性干扰”(selective interference)的道理,可以把对音节的处理跟句法成分的处理分开来。所谓“选择性干扰”,就是说同时执行两项任务时,两项任务的性质越相似,互相干扰越大。而执行不同的任务,则干扰比较小。如我们可以一边做作业一边听歌曲,但是同时听两首歌曲或做两门功课就很困难。同样,处理音节内部、词内部的结构时,对处理句法结构干扰不大。因此我们可以用“词”为基本单位去计算脑子中记住的板块数目。

      在句子理解领域,一般都认为我们大脑里有一个语音—词汇处理机制,还有一个句子处理机制(Frazier et al.,1993);当我们读到一个字(如“下”),我们一般把它放在语音—词汇处理器里面,然后继续读下面的字(如“午”),并在词汇处理器里把这两个字组成一个词,提交到句子处理器里进行组块。当然,将一部分组块工作放到语音—词汇处理机制去处理,不是说词汇处理对整个处理的负担没有影响。事实上,两个过程肯定是互动的,而表达这种互动关系的方法之一是数量转换,如计算出词汇处理难度对句子处理难度的影响大小。由于我们暂时不知道短时记忆跟语音—词汇处理的关系,可以暂时把词汇处理过程忽略不计。

相关文章: