[中图分类号]H030 [文献标识码]A [文章编号]1003-6105(2004)04-0350-10 1.引言 汉语回指主要有三种形式:零形回指(Zero anaphora),代词回指(pronominal anaphora)和名词回指(nominal anaphora)(陈平1987)。其中,零形回指的出现频率最高,分布最广泛,似乎不受限制,被认为是汉语回指的标准模式(Li & Thompson l979)。 回指解析(anaphora resolution)是指为回指词(anaphor)确定其所指(referent)的过程(Hirst 1981)。它一直以来就是自然语言处理(Natural Language Processing,简称NLP)发展的主要障碍之一,近十年来引起了许多研究者的关注。 本文主要研究如何运用向心理论(Centering Theory)来解析汉语中的零形回指。向心理论是由美国语言学家和认知科学家在20世纪末发展起来的关于语篇处理和语篇局部结构的理论。这一理论出现后,引起了人们的极大兴趣,并已被广泛地运用于语篇分析、语篇的计算机处理和句法分析等研究领域(苗兴伟2003)。 向心理论是一种话语阐释的计算模型,它可以考察注意状态、指称形式和推理过程的控制之间的相互关系,因其简洁而易处理,一直作为回指解析的主要算法之一(Yamura-Takei et al.)(注:这篇文章是从网上下载的,下载的网址在参考文献中已给出,但无法确定此文章是否发表,或发表的时间,敬请见谅。)。它被用来研究主题突出型(topic-prominent)语言(比如,汉语和日语)中的隐性论元(或称为零形论元);因为在这些语言中,特定语境中通过推理可以找回的凸显性语义实体(salient entity)经常被省略。向心理论可以为零形式(zero form)找回它的所指,因此,我们也希望向心理论能够有效地解决汉语中的零形回指解析问题。 2.汉语中的零形回指 话语中提到某个事物之后,再要论及该事物时,一般使用各种回指形式同上文取得照应。零形回指是话语结构中一类较为特殊的指称形式,它是指一种没有语音形式、无形有义的照应手段,通过零形式从先行项(antecedent)那里获得指代表现出来的一种特性(尹邦彦l999)。与非零形回指不同,零形回指没有实在的词语表现形式可供我们辨认,因此确定这种回指形式在具体场合中存在与否,如何判断回指词的有关性质,成了我们必须首先解决的问题。在这个问题上,陈平(1987)认为主要依靠全句的语义和语法格局,如果从意思上讲句子中有一个与上文中出现的某个事物指称相同的所指对象,但从语法格局上看该所指对象没有实在的词语表现形式,我们便认定此处使用了零形回指。所谓词语形式上没有而意思上有的成分,一般限于下面两种情况: (一)谓语动词的支配成分 (二)主谓谓语句、名词谓语句、形容词谓语句等非动词谓语句中的主语 本文中,我们采用陈平提出的这个判断标准,下面举例说明: (1)
就从门里甩了出去。(注:
表示零形式;下划线部分表示一个语义实体;下标i,j,k…用作区分符号,下标相同表示所指相同。)(贾平凹《地震》)
例句(1)和例句(2)是根据上面的原则标记的。例句(1)中的零形式主要出现在动词谓语句中,充当谓语动词的支配成分;例句(2)中的零形式充当非谓语动词句的主语。 根据零形回指词(zero anaphor)和它的先行词是否在同一个句子结构中,零形回指可以分为句内零形回指(intrasentential zero anaphora)和句间零形回指(intersentential zero anaphora)(Li & Thompson 1981)。这里所谓的“句”,为了便于分析和行文,我们定义为口语中有语音停顿,书面中有点号标记的主谓结构(含主语或宾语为零形式的情形)。也就是说,这里讲的句子,是仅就句法层面而言,不管是否能单独表达满足交际需要的完整意思,它不同于传统语法学中一般的“句子”概念(王灿龙1999)。
按照我们刚才的定义,例句(3)的整个部分,我们称之为语篇片段或话语片段(discourse segment),它包含了五个语句(utterance),语句将是我们的分析单位。 根据Li & Thompson(1981),在汉语中,句内零形回指主要出现在主题句(topic-prominent construction)中,例如: