一 引言 词语的褒贬义问题在汉语词汇学中研究得比较多,但在机器翻译和对外汉语教学方面依然存在着不少实际困难。外国学生往往难以区分出意义相近而褒贬义不同的词语,机器翻译上也存在着褒贬译词选择不准的问题。近几年来,随着态度计算的日益展开,词语、句子和篇章的倾向性计算成为计算语言学研究的热点,而褒贬义词语作为语言中最基本的倾向性要素,其分析也成为一项重要的基础工作。 在语言学界,褒贬词语的研究主要集中在褒贬色彩分析和确认(解海江、张志毅,2003)、历史流变(孙雪敏,1999)、语境变异和译词选择(刘全福,1999)等方面,从动态、静态和历时的角度界定词语的褒义和贬义。 在计算语言学界,近年来随着态度计算的兴起,研究者开始对含有态度评价的动词区分出“评价者”“态度”和“评价对象”三个评价角色,并描写评价角色和句法成分或语义角色之间的关系。晋耀红(2004)针对评价性动词(如“支持”“反对”“污蔑”等)建立了褒贬模板,描写了每个动词的评价角色和“说话人”“施事”和“受事”三个语义角色之间的对应关系。Bethard et.al(2004)则利用FrameNet的动词框架,人工标注了英语评价性动词的评价信息和框架元素的对应关系。刘永丹等(2004)也采用了动词模板的方法来处理中文语料。这些研究都是基于格语法的思想,静态地描写动词的评价角色和语义角色之间的对应关系,并以模板匹配的方式来避免完全句法分析的低效性。不过,这些实验使用的动词仅是少量的高频词,覆盖度较小。Wilson & Wiebe(2003)、徐琳宏等(2008)则在建设情感态度语料库的过程中,动态地标注了句子中态度的所有者、评价对象、态度及强度。这样全面的标注对于实际应用中机器学习及自动标注提供了良好的基础,但尚未提炼出具有理论意义的认识。虽然计算语言学界主要描写的是评价性动词,但对褒贬词语的分析来说有着直接的借鉴意义。 综上所述,在语言学界,传统的词汇语义研究在褒贬义的判定上做了定性分析,而计算语言学在实际任务中区分出“评价者、态度和评价对象”三个要素。从更高的层次上看,目前态度计算尚缺乏对语言中表示态度的句法语义手段的系统考察和分析。本文尝试在这方面做一些探索,把褒贬义和句法语义层面结合起来进行研究。 二 褒贬指向的界定 褒义和贬义,是凝结在词语中的意义,表达了人们对事物的褒贬态度。在过去的研究里,词汇学关心的主要是词语褒义和贬义的分析和界定,还没有清晰地指出褒贬中蕴含的“评价者”和“褒贬对象”这两个重要角色。例如,在句子“他讨厌小王”中,贬义动词“讨厌”,其评价者是施事“他”,所贬斥的是受事“小王”;而在句子“他包庇小王”中,情况则发生了变化。很明显,“小王”是被贬斥的对象,可是贬斥“小王”的人不能说是施事“他”,而是说(写)这句话的人,而且从“包庇”的词义上看,表达的主要态度是说话人对施事“他”的贬斥。“讨厌”和“包庇”,都是贬义的二价动词,在褒贬的方向上却有很大的差异。这种差异,在区分出“评价者”“褒贬对象”并与动词的语义角色对应之后才看得较为清楚。 我们把一个褒贬词语所关涉的对象限定为一个三元组:〈评价者—褒贬态度—褒贬对象〉,把“评价者”和“褒贬对象”称为“评价角色”,进而把褒贬词语的“褒贬指向”定义为:由褒贬词语的褒贬义所决定的,评价者对褒贬对象的态度在语义角色上呈现的指向性,如“施事褒受事”“说话人贬施事”等等。在本文中,我们区分出“说话人”“施事”“受事”和介词引导的“与事”四种语义角色。后三种成分与格理论、配价理论的一般界定是相同的。“说话人”是一个比较特殊的角色。既可以在句子中出现,也可以不出现。出现的情况主要是采用直接引语,如“他说:‘大家都夸奖我。’”或者采用间接引语“他说大家都夸奖自己”。在真实话语中,引语出现得较少,“说话人”往往就是话语的直接作者。 提出“褒贬指向”以后,需要进行两方面的考察验证:(1)动词的配价是否会影响褒贬指向的数量。二价动词“讨厌”和“包庇”,分别体现的是施事贬受事、说话人贬施事受事两种差别很大的指向。那么一价动词和三价动词的情况又会如何?(2)动词以外的其他词类是否也可以做褒贬指向的分析。褒贬词语不局限于动词,名词“风度”、形容词“安详”、副词“大肆”等其他词类的词语,可以出现在多个句法位置上,它们在不同句法位置上的褒贬指向以及和配价的关系也是有待考察的对象。 三 词语褒贬指向的分析 为了较为系统地考察汉语褒贬词语的褒贬指向问题,并尽量避免某个词语是否具有褒贬色彩的争论,我们选择了《汉语褒贬义词语用法词典》(以下简称《褒贬词典》)作为分析对象。该词典收录了现代汉语中常用的含有褒贬感情色彩的多音节词语共1015条,包括名词、动词、形容词、副词、成语及惯用语,所标注的褒贬色彩分别为褒义、贬义、敬词、谦词和客套话。我们仅考察其中的褒贬义词语992条。对成语和惯用语,我们按照名词、动词、形容词、副词标注了词类,整理后得到142个名词、294个动词、540个形容词和16个副词。我们对这些词语按照词类依次进行分析,分析一般限定在句法功能(主语、谓语、宾语、定语、状语、补语)、配价数(零、一、二、三)、语义角色(说话人、施事、受事、与事)和褒贬态度三元组(评价者、褒贬态度、褒贬对象)的范围中。为了方便说明,本文中的例句采用如下格式:“我们要捍卫祖国的尊严。”评价者加下划线,褒贬词语加着重号,褒贬的对象加下波浪线。 (一)动词的褒贬指向 动词的褒贬指向是最有代表性的。动词一般充当谓语的核心成分,其配价的多少往往决定了其褒贬指向的数量。在我们考察的动词中,没有出现零价动词。因此,下面只讨论一价至三价动词的情况。在分析过程中,我们发现有4个褒贬词语应为中性词,即“株连、损失、美化、奇货可居”,排除在考察范围外。