一 引言 一般说来,“名词”、“主语”等是所谓的句法概念,而“论元”、“题元”、“施事”等是所谓的语义概念。经过相当长时间的理论思考与实践,汉语学界对“名词”、“主语”这样的句法概念基本形成了共识,就是应该从功能分布角度或者说应该主要以形式标准来认识这些概念,但对于“论元”、“题元”、“施事”这样的语义概念,如何认识它们的性质,以及对这些概念应如何定义,目前似乎还存在不同的看法。徐烈炯、沈阳(1998)曾指出,“各种语言中对题元定义都会存在种种差异,解决这种问题,不能单单从某些动词与某些名词的直接词语联系来逐个判定,更需要找到一种整体的原则。” 我们曾经从计算机处理汉语时的实际需求的角度出发,讨论过语义范畴的确定原则以及语义范畴的相对性(詹卫东,2001)。本文拟进一步来讨论“论元”、“题元”等所谓语义概念的实质,希望阐发这样两个观点:1)就计算机处理自然语言的要求来说,对这些语义概念,要跟对待句法概念一样,研究如何以形式标准来加以定义,因为只有以形式标准加以定义,对计算机处理自然语言才有用,而且好用;2)要以形式标准对“论元”、“论旨角色”等语义概念进行定义,一个主要的办法就是进行句式之间的变换测试,观察动词及其相关名词性成分对不同句式的适应性。我们认为,在以计算机为背景来认识“论元”、“题元”、“施事”等概念时,上述两点应该被看作是技术层面上定义语义范畴的“整体原则”。 为了更好地阐述我们的看法,不妨先扯远一点,让我们从“什么是意义”这个古老的问题谈起。哲学和语义学对这个问题从不同角度给出了许多不同的理论表述(徐烈炯,1995)。虽然限于篇幅,本文不可能对这个问题加以展开,但不妨来看看,对于计算机来说所谓“知道一个语言形式的意义”是“什么意思”。我们的认识是: 1)理解“意思”的过程,可以表示为对符号进行“变换”的过程。 这样的符号变换可以在一种语言内进行,可以在不同语言之间进行,甚至也可以在不同性质的符号系统之间进行。比如: a.在一种语言内进行的符号变换。 “张三打了李四”→ “李四被张三打了” b.在不同语言之间进行的符号变换。 “张三用手打了李四”→"Zhang San hit Li Si with his hand" c.在不同性质的符号系统之间(比如视觉符号系统与听觉符号系统)进行的符号变换。
→“这是残疾人通道” 以上各例中,箭头左边的“表达形式”的“意义”,均可以用箭头右边的“形式”来表述。换言之,如果把箭头左边的形式作为输入,箭头右边的形式作为输出,输出端就是输入端的“意思”,而输入输出的过程,就是对输入符号串进行变换的过程。 2)这个符号变换过程没有止境。(注:或者说人们总是根据“需要”来停止变换操作,而“需要”是无止尽的,也是难以确定的。) 通过符号变换操作来表示一个语言成分(形式)的“意思”,有多种可能性。对此也可看作一个语言形式有一条很长的“意思”链。在日常语言使用中,人们在这个链上选取了一个当时(即确定的语境下)比较好用(有效)的环节,作为通常所说的“意思”。比如: d.“张三买了辆车”→意思1:张三把车买回来了 意思3:张三可以使用这辆车 意思2:张三拥有了一辆新车 意思4:张三的钱都花完了 …… 如果把上面a-d例中左边的表达形式作为“输入”给一台计算机,计算机能够“变换”出a-d例中右边的那些形式作为“输出”反馈给人看,那么,人们很可能会惊呼“这台计算机懂我的意思了”。其实,人与人之间的交际过程也是在这样的输入输出的交替变换中进行的,正是在这样的变换中,人们相互之间就“显得知道对方的意思”了。 根据上面的描述,如果能够从一种形式A向另一种形式B做“正确的”(或“恰当的”)变换,B就是A的一个“意思”。而为了保证“变换”的“正确性”,就要保证: 1)B本身必须是一个“合语法”的形式; 2)B跟A之间要满足某种“关系”(比如同义、蕴涵等逻辑关系)。 实际上,人们设计出的句法范畴也好,语义范畴也好,目的都是为了保证这两个层面上的“正确性”。(注:从保证“变换的正确性”的角度说,语法研究的目的可以看作是为了保证最基本的正确性。人能够自由地进行理论上无止境的变换游戏,除语法知识外,还需要逻辑知识,并且还涉及历史文化、社会生活等百科知识,后者更是计算机目前难以掌握的,因而也不可能像人一样自如地进行形式变换。从这点上来说,变换显然是有层级的,变换的能力依赖于知识的多少。本文讨论的句式变换仅限于语法研究的范围内,只涉及语法条件制约的变换。暂不涉及逻辑层面(比如“蕴涵”关系),更不涉及由百科知识控制的变换。)引入“论元”、“施事”这些语义概念,跟“名词”、“主语”等句法概念一样,都是为进行正确的变换提供有效的条件。基于此,如果自觉地直接从“变换”的角度去认识和定义这些所谓的语义范畴,就能帮助计算机更好地去控制和模拟理解自然语言意思的过程。