关于句处理中所要考虑的语义问题

作 者:

作者简介:
陆俭明,北京大学 100871 北京 北京大学中文系

原文出处:
语言研究

内容提要:


期刊代号:H1
分类名称:语言文字学
复印期号:2001 年 06 期

字号:

      中图分类号:H087;H13 文献标识码:A 文章编号:1000—1263(2001)01—0001—12

      零引言

      中文信息处理必须坚持“结合”的原则,具体说:

      1 统计与规则相结合;

      2 句法与语义相结合;

      3 汉语研究理论与国外有关理论相结合;

      4 现代语言学理论与中国传统语言学理论相结合;

      5 基础研究理论与项目研制开发相结合。

      本文只就上述第三个原则,具体说只就中文信息处理中在解决句处理时所需关注的语义问题,谈一些不成熟的意见,以求教于大家。虽然本文是从中文信息处理的角度来考虑的,但对于汉语本体研究也可能有所裨益。

      一 句处理的含义

      在中文信息处理中,当前迫切需要解决的问题是句处理的问题。所谓“句处理”,其含义,按我的理解,当是:怎么让计算机处理、理解自然语言中一个句子的意义,怎么让计算机生成一个符合自然语言规则的句子。这也可以说是句处理的目标。为实现这一目标,必须坚持:

      1 对句处理中所关及的语义问题要分层处理, 即要分不同层次进行处理。 譬如,要把一个句子的M(Modality)与P(Proposition)分开处理;要把一个句子本身的命题义与句子在使用环境下可能具有的语用义分开处理;在句子本身的命题义中,还得分层处理由实词带来的意义和由虚词带来的意义,等等。

      2 既要弄清单元(如某个词或词组, 本文只考察词)本身的意义,又要弄清单元与单元组合所产生的种种意义。

      3 要解决好句中缺省部分的添补与理解问题。

      4 通过研究所获知的知识必须可计算。

      事实告诉我们,“句处理”中所要考虑的语义是多方面的。关于这个问题,已有所讨论。本文只就实词本身的意义以及在实词与实词的相互关系或相互组合中所呈现的意义作一些初步的探索。

      二 实词的自身义

      “自身义”是指某个实词本身的意义。这又可细分为概念义、指称义、语义特征三种。

      2.1 概念义

      概念义,事实上可以从两方面去加以理解,一是从外延的角度,一是从内涵的角度。从概念外延的角度所理解的概念义,可称之为“概念外延义”(简称“外延义”);从内涵的角度所理解的概念义,可称之为“概念内涵义”(简称“内涵义”)。这里试以名词为例加以说明。举例来说,“农民”,《现代汉语词典》上的解释是:“在农村从事农业生产的劳动者。”这也就是“农民”的概念义。但下面两个句子里的“农民”涵义并不相同:

      (1)这两位农民是从四川来的。

      (2)在农村劳动一年,他是个农民了。

      例(1)里的“农民”是取外延义,例(2)的“农民”是取内涵义。

      对于内涵义,还可以细分为类属义、内在性质义、附加性质义。再以“农民”为例,其类属义是:{事物·人·劳动者};其内在性质义是:{在农村从事农业生产};其附加性质义是:{勤劳·朴实·憨厚·比较保守·文明程度低·……}。就名词来说,当取其内涵义时,该名词往往不指称具体的某个事物。外延义,含明显的指称性;可以这样说,实词的外延义,是指所有具有该词内涵义特征者。再拿“农民”为例,我们也常常可以这样说:

      (3)他呀,比农民[,1]还农民[,2]。

      例(3)里的“农民[,1]”就取的词的外延义,“农民[,2] ”就取的词的内涵义。

      词的概念义中,除外延义和内涵义外,还含语体义。例如,“农民”、“农人”、“种地的”、“乡巴佬(儿)”,其外延义与内涵义是相同的,所以都可以用来表示“在农村从事农业生产的劳动者”这个意思,但它们的语体义不同:“农民”是个中性词,口语书面都可以用;“农人”则是个早期书面语词,先只见于书面语;“种地的”和“乡巴佬(儿)”都是口语语词,书面语上不用,其中“乡巴佬(儿)”还含贬义。

      2.2 指称义

      概念义,词在进入句子前就具有的,只是进入句子后显示得更清楚。指称义则是词(具体说是名词)进入句子后才具有并显示的。

      指称义,可以分为三组:有指~无指,通指~专指,定指~不定指。

      2.2.1 有指~无指(referential or non-referential)

      所谓“名词的有指”,(注:关于“名词的有指无指”,以及下文的“名词的定指不定指”、“名词的通指单指”,均参见陈平(1987):释汉语中名词性除非相关的四组概念,载《中国语文》第2期; 又见(1991)《现代语言学研究——理论·方法与事实》,重庆出版社。)是说某个名词所指确有具体之人或物;所谓“名词的无指”,是说某个名词所指并无具体之人或物。例如:

      (1)他考过研究生。

      这个句子有歧义,就跟“名词的有指与无指”有关。这个句子里的名词“研究生”,既可以看作是指人的名词,也可以看作是标示学业程度的抽象名词。按前者理解,句子的意思是“他对研究生进行过考核”,“研究生”属于有指;按后者理解,句子的意思则是“他报考过研究生”,“研究生”属于无指。而这对于句法有一定的制约作用。例如,按前者理解,“研究生”前既可以加上表动量的数量成分,也可以加上表名量的数量成分,例如:

相关文章: