1.引言 儿童对于英语动词过去时的习得一直是心理语言学研究的重点问题之一。传统的观点一直认为,对规则的动词变化,儿童会利用规则产出其过去时形式,而对不规则动词的过去时形式,儿童则将不规则形式存储在记忆中[1]。但是Rumelhart和McClelland[2]发表了题为《关于英语过去时的学习》这篇文章,对上述传统的观点提出了质疑。他们设计出了Rumelhart-McClelland模型(以下简称RM模型)来模拟儿童对英语动词过去时的习得过程,该模型标志着认知科学中一种新的范式——联结主义的兴起,并向传统的符号主义提出了挑战。随后,传统的符号主义的支持者Pinker和Prince[3]对RM模型提出了质疑,认为这个模型并不能够成功模拟儿童习得过去时的过程,因为该模型仅对动词的语音特征进行表征,动词的形态结构在模型中并没有体现,而且这个模型的性能并不理想,在进行测试时,这个模型不能正确提供33%的规则动词的过去时形式。Pinker和Prince[3]的论文拉开了争论的序幕。此后至今的20多年里,不断有学者参与到双方的讨论之中,讨论的内容也从儿童对英语过去时的习得扩大到成人和失语症患者对不同语言中过去时形式的表征和处理过程等问题。据Pinker[4]的不完全统计,至少有150篇论文与此争论有关,这些文章多发表在著名的国际期刊上,如《科学》[5;6],《自然》[7],《语言》[8]等。研究人员还设计出了至少25个联结主义模型来修订RM模型中存在的问题。 通过对规则形式和不规则形式加工的讨论,我们可以更加深刻地理解语言处理和表征的心理机制,探讨符号主义和联结主义的语言观的主要分歧。本文将重点介绍双方争论的三个焦点问题,即语言处理需要规则还是联结,规则形式和不规则形式的处理是由同一个心理机制还是两个不同的心理机制来完成的,究竟应该将大脑视为模块的符号处理系统还是多元的人工神经网络。 2.规则还是联结 从上个世纪50年代末开始,Chomsky一直是语言学界最为重要的领军人物,他的思想对心理语言学产生了深远的影响。Chomsky认为语言知识从根本上讲是一种心理机制,而这种机制的根本就是形式语法系统。也就是说,人脑是通过一个内在的规则系统(即形式语法)来加工和处理语言的。Chomsky指出[9:8]:“很明显,每一个讲话者都掌握并且内化了一种表达自己语言知识的生成语法(即一个规则系统)。当然,这并不是说他知道或者甚至能够知道这些语法的规则。”受Chomsky理论的影响,心理语言学家认为,只有规则系统才能够有效地反映大脑包括语言处理在内的高级抽象活动,学习语言就是一个学习规则的过程[10]。Pinker[6;11;12]认为,抽象的符号规则在语言处理的过程中起着关键性的作用,这些规则以命题的形式储存在人的记忆当中,并且应用于语言的产生、理解和判断过程。但是,这些命题是内隐性的,不能够用语言明确地描述出来,因为它们可能只是存在于用于语言处理的专门系统之中,也有可能是用只有语言处理系统才能够理解的特殊代码编写而成的。
图1 RM模型的基本结构[2:222] Rumelhart & McClelland[2]提出了不同的观点,他们认为规则在语言的习得与处理过程中并没有起到作用,Chomsky所提出的规则系统只能够用于描述语言本身,并不能够用于描述语言习得与处理的过程。鉴于此,他们认为联结主义的模型更加适合解释语言习得的过程,儿童是在大量接触语言的基础上,建立起动词词根的语音特征与过去时形式的语音特征之间的联结,并通过调整动词词根和过去时形式之间联结权重的方式来习得动词的过去时态。无论是规则的过去时形式,还是不规则过去时形式的产生均不需要规则,只需要基于与已知动词语音上的相似性即可以产生。图1即是Rumelhart和McClelland[2]在1986年提出的用来模拟英语动词过去时习得过程的RM模型。该模型为单向输入,并没有对规则的表征,只包含相互联结的类似于神经细胞的单元。如图1所示(自左向右),RM模型包括三个组成部分。第一部分是一个固定的编码网络,负责把输入的动词词根的语音表征转化为Wickel特征表征,即把词汇的语音形式表征为一系列的音位单元,其中每个音位单元由某个特定的音素及与该音素紧邻的前一个和后一个音素组成。例如;help就可以被表征为_he,hel,elp和lp_。第二个部分是整个系统的关键,由一个可调节的模式联结器(patternassociator)组成,负责完成从动词词根的语音形式到与其相应的过去时的语音形式之间的映射,所有的学习和训练过程主要是由这个部分来完成的。第三部分是一个解码网络,负责把过去时形式的Wickel特征表征解码为其语音表征。这个模型的训练采用了Rosenblatt[13]的感知合并程序(perception convergence procedure)。在训练这个模型时,研究人员会将某个动词的词根及其正确的过去时形式输入到模型中。该模型首先对词根进行编码,然后计算输出单元中Wickel特征表征的激活值,最后将这个值与该动词相对应的正确过去时形式的激活值进行比较。如果计算出的激活值与正确的值相匹配,就说明相关联结之间的权重值合理,不需要进一步学习。相反,如果一个应该被激活的单元没有被激活,相关联结之间的权重值就会相应增强,激活阈值也会相应地降低。同样的,如果一个不该被激活的单元被激活了,那么就要相应地降低相关联结的权重值,激活阈值则会相应提高。这样,整个系统经过大量的训练(即学习的过程)就可以逐渐掌握词根和它们的过去时形式之间的联结权重,从而模拟儿童习得语言的过程。RM模型是一个经典的联结主义模型,随后的联结主义网络模型采用了“反馈学习法”(back-propagation method),在模型中加入了隐藏节点,进一步提高了模型的性能。