近年来语义研究在整个语法研究中的重要性日益显著。与此同时,有关语义的一些基础问题在研究过程中又时常引起争论,比如动词配价的性质问题,动词论元角色的语义类型如何确定,动词配价与句式之间的关系问题,等等[参考文献10,11,12,16]。对此,我们可以结合计算机处理汉语的实际需求来看待有关语义范畴的争议,或许能够提供给我们一个更为有效的参照系。本文尝试从这种思路出发,就确立语义范畴的基本原则进行讨论,并试图阐明语义范畴跟语言中的其他范畴一样,都具有相对性,一些表面的争议问题其实不过是一些伪问题,从而将研究者的关注点引向真正的问题所在。 1 确立语义范畴的原则 跟语言学中的大多数问题(比如词类问题、主宾语问题等)一样,确立语义范畴时碰到的问题如果能从目的着眼来审视,可以看得更清晰,也就是说,首先应该弄清楚,我们要拿语义范畴来干什么用? 1.1 语义知识的作用 1.1.1 从知识的表现形式上讲,语义知识包括两种类型:一种是所谓范畴型知识,即可以表述为“属性:值”(即复杂特征集)这种形式的知识;一种是所谓规则型知识,即可以表述为“条件->动作”(即产生式规则)这种形式的知识(文献[19])。举例来讲,在一部语义词典中,可以记录有下面这样的信息: 苹果:=[语义类:可食物,物态:固体];汤:=[语义类:可食物,物态:液体];圆:=[语义类:物形] 吃:=[语义类:获取,论元:2]{施事:[语义类:动物|人类],受事:[语义类:可食物,物态:固体]} 需要说明的是,以“属性:值”形式记录的范畴型语义知识又包括两种情况,一种可以称之为简单范畴型语义知识,刻画的是一个对象的基本语义属性(上面以[ ]括出的内容),比如[语义类:可食物];一种可以称之为复杂范畴型语义知识,刻画的是两个以上对象之间的基本语义关系(上面以{ }括出的内容),比如用来描述动名语义约束关系的{施事:[语义类:动物|人类]}(这里“|”表示逻辑上的“或”关系)。不难看出,复杂范畴型语义知识的“属性:值”形式表示中,“值”是用若干简单范畴型语义知识来刻画的。 同时我们还有下面这样的规则型的语义知识(注:这里是用自然语言的表达方式来说明这条规则,在计算机使用时,为了操作方便,通常是以一定的符号化(形式化)的手段来表达的,有关说明可参见文献[19]。): 如果一个名词的语义性质跟一个动词的受事论元的语义要求吻合(条件),那么该名词可以跟这个名词组成“动作——受事”的组合形式(动作)。 显然,上述范畴型语义知识加上规则型语义知识,可以用来说明“吃苹果”(能说)和“吃汤”、“吃圆”(不能说)之间的差异。 1.1.2 就实际的自然语言处理应用系统来说,语义知识在不同的应用领域都可以发挥作用。概括地说,语义知识的作用是用来排除自动分析过程中碰到的各种歧义,这可以通过两种比较典型的情况——排除句法结构分析的歧义,以及在多义词义项判定中确定多义词的义项——来加以说明。 先来看语义知识在句法结构分析中所起的作用。 短语结构P[,1]“修汽车的后胎”跟P[,2]“修汽车的王师傅”在句法层面上,都可以抽象为“V+N[,1]+的+N[,2]”这样的序列(记作M),但其结构分析结果不同,前者是A.[修[汽车的后胎]];后者是B.[[修汽车]的王师傅]。要让计算机能够将P[,1]的结构分析为A,将P[,2]的结构分析为B,需要用到“施事”、“受事”、“整体——部分”这样的语义范畴。对于序列M,有规则:如果N[,1]跟N[,2]的语义性质跟V的受事论元的语义要求吻合,并且N[,1]跟N[,2]之间有“整体——部分”的关系,那么M的结构应分析为A;如果N[,1]的语义性质跟V的“受事”论元的语义要求吻合,N[,2]的语义性质跟V的“施事”论元的语义要求吻合,那么M的结构应分析为B。 再来看语义知识在多义词义项判定中所起的作用。 “想主意”(以“想[,1]”代表)跟“想女儿”(以“想[,2]”代表)中的两个“想”意思不同,前者是“思考,思索”的意思(形式上表现在可以变换成“想出主意”,不能变换成“想念主意”);后者是“思念,想念”的意思(形式上表现为可以变换成“想念女儿”,不能变换成“想出女儿”),对此,需要“想”的“受事”论元的语义约束信息来帮助计算机作出判断。“想[,1]”的“受事”论元要求不能是[语义类:人]这样的名词,相反,“想[,2]”的“受事”论元要求是[语义类:人]这样的名词。“主意”跟“女儿”两个名词的“语义类”属性取值分别为[语义类:方法]和[语义类:人],计算机可以通过匹配知道“想”跟“主意”搭配时是“想[,1]”,跟“女儿”搭配时是“想[,2]”。基于上述语义知识,计算机不仅能在简单述宾结构中确定“想”的义项,也能确定“张三想的主意”(复杂的定中结构)中“想”的义项。 1.1.3 无论从自然语言处理系统的实践,还是从语言学研究本身的理论追求来看,都可以发现,人们构造语义知识系统的根本目的,实际上跟句法知识系统是同样的,都是为了描述(在某种意义上也就是解释)某个“语言形式”是否能说/可被接受,以及能说/可被接受的若干“语言形式”之间是否存在一定的变换关系。这一点在语言本体研究中也许因理论的厚重而妨碍了研究者的认识,而如果以自然语言处理系统为应用背景来观察,就比较清晰。实际上,如果我们能够透过“句法”与“语义”表面的理论分野(理论形式上的差别)去看它们背后的共性,就不难了解到,我们完全可以用看待“句法范畴”的眼光来审视所谓的“语义范畴”。