摘 要 从研究背景、实验研究和理论观点等几方面对中文双字词的表征与加工的有关研究进行了总结,介绍和分析了常用的几种实验研究范式和有关的实验结论,并对两种主要的理论模型进行了比较。在此基础上提出了进一步研究所应注意的几个问题。 关键词:双字词 表征 加工 近些年来,关于中文双字词如何识别的问题引起了国内外学者的重视,并进行了一系列研究。本文拟对有关的研究作一初步的整理和概括的介绍,在此基础上提出进一步研究注意的几个问题。 1 研究背景 对中文双字词的识别问题的关注部分地源于进行跨文字比较研究的需要。自70年代以来,有关多词素词(morphologically complexwords)的表征和加工的问题成为心理语言学研究的热点。围绕该问题已进行了大量的研究,其实验材料涉及了英语、荷兰语、意大利语、克罗蒂亚语、德语等多种文字,而且有越来越多的文字被卷入。 多词素词识别的研究重点集中在两个方面:a)多词素词的词汇信息及其词素结构的信息在心理词典(lexicon)中是如何表征的。b)多词素词的识别过程的加工单元或通达单元是什么?其具体加工过程是怎样的,是一直接通达整词词条还是通过调素词条的通达来识别整词?这两个方面有着内在的联系,第一个方面回答心理词典内词汇信息的组织方式,而第二方面回答词汇信息是如何补充激活和提取的。在拼音文字中,多词素词的研究主要采用了以下一些研究范式,如重复启动和词义启动、变化词频和词素频率、进行复合非词的研究等,运用这些研究范式进行了大量的实验,提出了许多有影响的理论模型,如整词表征与通达模型(Seidenberg 1987;1989)[1][2],词汇分解模型(Taft & Forster 1975;1976)[3][4],AAM模型(the AugmentedAddressed Morphology model),(Caramazza ct al 1988)[5]。整词表征的观点认为多词素词在心理词典中是以整词形式表征的,并没有独立的词素表征;词的识别是通过对整词表征通达来完成的,分解理论则认为多词素词在心理词典中是以分解的词素方式表征的,词素表征的通达是词汇识别的前提。而AAM模型认为词的识别有整词识别和词素识别两种方式,其中对高频词来说是整词识别,对低频词来说则是词素识别。 中文在某些方面不同于拼音文字,例如:在拼音文字中,多词素词从构词法上有三种类型:A、曲折变化词(inflected words),如BOYS,STUDIED等;B、派生词(derived words),如CAREFUL,STORAGE等;C、复合词(compound words),如BLACKBOAD等。与拼音文字相比,中文中有大量的复合词,但没有曲折变化词和仅有极少量的带词缀的词,而且在复合词中绝大多数是双字词。因此英文识别加工的一些假设,如前词汇的词缀自动剥落假设,对中文材料就不适用。对于英文复合词来说,其字形是一个整体(尽管它含有多个词素),如果对复合词的识别首先要通达词素表征,则需要在识别加工中有一个将整词切分为几个词素的过程。中文双字词从字形上看是两个分离的单元,故在识别时无须先对它进行切分。另外汉语复合词的构词关系好象比拼音文字更为复杂,例如在中文的合成词中有联合式、偏正式、主谓式、动宾式几种类型;而在拼音文字中,复合词的构词方式便没有这么复杂。因此对中文双字词的识别过程的研究及从理论上的解释必须结合中文自身的特点,而不能简单地照搬拼音文字研究的结论。中文复合词在心理词典中的表征方式及其加工过程有什么特点?这个问题已引起国内外众多研究者的注意。 2 中文复合词识别的实验研究 2.1 词素频率研究 张必隐和彭聃龄(1992)[6]采用控制词频,变化字频的方法研究了中文双字词的表征与存储方式,其实验假设为:在词频保持不变的情况下,如果词素频率的变化对词的识别过程有影响,则可以认为双字词的心理词典中是以词素方式表征的,反之如果词素频率的变化对词的识别过程没有影响,则可以认为双字词是以整词方式表征的。实验设计及结果如下: 在实验一中,实验材料为20个词频相同的联合式合成词(coordinative words),第一、二部分的实验条件分别为尾字频率保持恒定而变化首字的频率和首字频率保持恒定而变化尾字的频率。 实验结果显示:首字频率高和低两组的词汇判断反应时差异非常显著,错误率差异也非常显著。尾字频率的变化对反应时的影响达到了显著水平,错误率差异不显著。(见表1)
实验二的材料改为20个偏正合成词(modifier words),其中首字为对尾字的修饰。实验设计与实验一相同。结果显示在首字频率变化的条件下反应时和错误率差异均未达到显著水平,而在尾字频率变化的条件下反应时之差达到显著水平(p<0.025),错误率差异不显著。 实验三进一步探讨了在保持词素频率一致的情况下,变化词频对词的识别的影响。结果显示在字频完全相同的情况下,词频的变化对识别反应时影响显著(p<0.01),错误率差异不显著(p<0.05)。 三个实验的结果表明:词素(字)的频率与整词的频率对词的识别均有影响;联合式合成词和偏正式合成词的信息表征可能有所不同。作者对实验结果的解释为:在心里词典中双字词是以分解形式表征和存储的,即以字(词素)为单位存储,因此表现出词素频率效应。同时整词频率对词素表征之间的联系强度也有影响,所以对词的识别有影响。 Taft等(1994)[7]也发现了成份字的频率效应。在他们的研究中实验材料为词频相同的双字词,这些双字词根据其成份字的频率分为四组:高一高组(两个成份字都为高频字);高一低组(前字为高频字,后字为低频字);低一高组(前字为低频字,后字为高频字);低一低组(两个成份字都为低频字)。被试作业为词汇判断。结果发现高一低组和低一高组的反应时要长于高-高组,词素频率对词的识别是有影响的。但出乎意料的是,对于低-低组来说其反应时却与高-高组材料相同。其原因可能是由于低-低组的材料大多是构词数为1的单纯词,这些词本身就是一个词素,可能是作为一个整体单元进行表征的。