现代语言学给我们的启迪

作 者:

作者简介:
黄昌宁,男,清华大学计算机系教授,博士生导师,中国中文信息学会计算语言学专委会主任。长期从事计算语言学研究,曾主持完成多项重大科研项目。出版《人工智能原理》、《语言信息专论》,发表学术论文80余篇。 陆镜光,男,香港大学语言学系副教授。教学及研究范围包括语音、语法、语义、语用以及社会语言学等领域。著作有《粤语会话中口语助词的研究》、《香港的社会和语言》(合著),以及语音,语法和社会语言学论文数十篇。

原文出处:
世界汉语教学

内容提要:


期刊代号:H1
分类名称:语言文字学
复印期号:1999 年 02 期

关 键 词:

字号:

      近来汉语学界和外语学界从不同角度出发对汉语不同于印欧语言的特点以及建立适合于汉语特点的语言模型展开了热烈的讨论。比如,汉语究竟是语法型语言还是语义型语言,是主语—谓语型语言还是话题—评论型语言,汉语语法究竟是以词为基础还是以字为基础等等。人们期望通过这场讨论能出现一些新的语言模型,以推动现代汉语语法的研究。笔者从计算语言学的实践出发,认为在思考汉语的不同语言模型时,现代语言学的一些重要思想是值得充分借鉴的。

      一 现代语言学的一些重要思想

      (1)词汇主义(lexicalism)被视为现代语法理论的首要倾向。它认为词库收录的词条信息应覆盖人类遣词造句的几乎全部知识,以至于传统的句法规则库失去了单独存在的必要性。另一方面,词汇主义主张句法应反映维系一个句子语义联锁的那种词间关系,从而淡化了多年来在语法学界一直占支配地位的成分结构概念。代表词汇主义思想的语法理论有依存语法(Dependency Grammar)、范畴语法(Categorial Grammar)、词语法(Word Grammar)和链语法(Link Grammar)等。

      (2)在语言单位的描写上以复杂特征集取代早先的单一标记(即原子)。“合一”(unification)是一种专门用来对复杂特征集进行运算的数学工具,它类似于集合的“并”,不同的是如果两个特征集有某个属性值不相容,则它们的合一失败。以此为基础,80年代前后迅速形成了一批基于合一的语法理论,如词汇功能语法(LFG)、广义短语结构语法(GPSG)、中心词驱动的短语结构语法(HPSG)以及范畴合一语法(CUG)等。

      (3)主张语言在句法和语义两个层面上的平行、关联与同构(homomo-rphism),从蒙太格语法、GPSG到范畴语法都遵循所谓的“规则到规则”的假设,即认为每条句法规则都唯一地对应着一条语义规则,甚至有时候一条句法规则原本就是一条语义规则。

      (4)认为组合性(compositionality)是句法学和语义学的共同基石。由于词义是短语义和句义的基本组成单位,词汇语义学研究和词汇知识库的建设已成为整个学界关注的焦点。从计算和工程的观点来考察,语义描写的关系模型已取代了早先的语义场理论和义素分析理论,这一点可以用格语法和英语词汇知识库WordNet普遍受宠的情况来证实。

      下面通过对范畴语法和链语法的初步介绍来具体说明现代语言学的上述特色,希望能对建立汉语的句法—语义模型有所帮助。

      二 范畴语法

      范畴语法是一种植根于语言哲学、逻辑学和代数演算的语言学传统。它对自然语言本质属性的认识酷似依存语法,而与多年来占支配地位的成分结构传统完全不同,即认为维系一个句子的是反映其语义联锁的构造模式(constructive pattern),而不是句子被切分时的解析模式(ana-lytic pattern)。范畴语法刻意使语义直接表示于句法之中,是它备受语言哲学家和部分语言学家钟爱的重要原因,而其算术上的透彻性,则使它在逻辑学,形式语言学和计算语言学中常盛不衰。范畴语法又是词汇主义的典型代表,素有彻底的词汇主义之称。在范畴语法中,任何一个词条的句法行为都直接用它的词汇范畴——原子范畴或复合范畴来表示。最初,在逻辑学和语义学动机的驱使下,只设置了句子S和名词性成分N两个原子范畴,在逻辑语义层面上,S又代表陈述句所表示的真值命题(proposition),而N则代表该命题中的论元(argument),用配价语法的观点来看,在一个句子中除了S和N这两个原子范畴以外,别的语言单位都是非自足的。或者说是“未饱和的”(unsaturated),需要有其他与之同现的词项来共同组成意义完足的结构。在数学上,我们不妨把句子中除了S和N以外的语言单位都看成是函数,把将和它们结合成新结构的那些语言单位视为该函数的变元,而函数的值便是两者合成所得的那个新结构。举例来说,一个不及物动词可以用复合范畴S\N表示,其中的反斜杠N("\N"),说明其变元是在它左面出现的某个名词性成分N,函数值则是句子S。所以,不及物动词complains(S\N),同它左面的名词N:Tom(作为主语)结合将生成句子S:Tom complains.同理,一个形容词要用复合范畴N/N表示,其中正斜杠N("/N")指明其变元是在它右面出现的名词性成分N,而函数值则是一个新的名词性成分N。所以,形容词poor(N/N),同它右面的名词N:Tom结合,将组成一个新的名词性成分N:poor Tom。以此类推,及物动词的复合范畴记作(S\N)/N,表示它先同右面的名词性成分N(作为宾语)结合,得到范畴S\N,然后,再同它左面的另一个名词性成分N(作为主语)结合成为句子S。

      

相关文章: