中文信息处理专题研究:语义研究

——汉语的意合网络

作 者:
鲁川 

作者简介:
鲁川 河南财经学院人工智能研究室,邮编:450002

原文出处:
语言文字应用

内容提要:

汉语是“语义型语言”。意合网络是适合汉语“语义组合系统”的形式化图解,也是智能电脑的“知识表示”。意合网络是由各级“语义单位”组成的能清晰表示“语义关系”“语义依附”和“语义指向”的有层次的网络。本文详述了汉语意合网络的内容和形式。


期刊代号:H1
分类名称:语言文字学
复印期号:1998 年 08 期

关 键 词:

字号:

      引言

      世界上各民族的语言按照其思维方式和编码体系可以分为两种类型:

      一、以英语为代表的“句法型语言”。这种语言的主要特点是:句子结构的线性序列是“主语—谓语”,语言单位的组合手段是“形态变化”(Inflection)。

      二、以汉语为代表的“语义型语言”,这种语言的主要特点是:句子结构的线性序列是“话题—述评”,语言单位的组合手段是“意合法”(Semotactics)。

      汉语信息处理应从汉语是“语义型语言”的特点出发,加强对“意合法”的研究。

      美国学者奎廉(M.Quillian)1966年从心理学角度研究人的记忆时提出了“语义网络”(Semantic Network)。后来经过西蒙斯(R.Simmons)和亨德里克斯(G.Hendrix)等的改进,比较成功地用于英语的“知识表示”和“自然语言理解”。为了适合于汉语信息处理,我们对语义网络的内容和形式作了改进,称之为“意合网络”(Semotactic Network)。

      意合网络是“语义组合系统”的形式化图解,也是智能电脑的“知识表示”。意合网络是由各级“语义单位”组成的,清晰表示“语义关系”“语义依附”和“语义指向”的有层次的网络。

      把语义组合关系标注在句法结构分析图上是不行的。句法结构分析图是“树形图”,它只能标注“父节点”跟“子节点”的关系,不能够标注“兄节点”跟“弟节点”的关系,而“网络图”则可以标注任何“节点”之间的关系。

      例:刘大嫂死了三只鸡。

      

      此句子[事件]的中枢是“死了”[变化]。“三只鸡”是“死了”的[当事](承当者)。“刘大嫂”是“死了”的[涉事](受损者)。“刘大嫂”跟“三只鸡”之间必有领属关系:“刘大嫂”是[领事],而“三只鸡”是[属事],即“死了”的是“刘大嫂的三只鸡”。

      这个句子不能扩展为:*“刘大嫂死了别人的三只鸡”。

      在“句法树”上,主语跟宾语的语义关系无法标注,所以必须用“意合网络”。

      向电脑输入自然语言的“线性序列”,如果电脑能把表层的“线性序列”自动地变成深层的“意合网络”,则可以认为电脑“理解”了自然语言。

      

      一 意向网络中的语义单位

      语义单位是语义平面上的单位:“概念”“标记”“事件”。

      (一)概念(Concept)

      “概念”是对客观事物及其特有属性概括的反映,是所传递的全部信息中的客观信息。概念的形式是一个语言符号串。一个概念是意合网络的一个“节点”(Node)。

      1.述谓概念(Verbal Concept)

      在认识客观世界时,人们使用这样的一种语言符号串来叙述所指事物的运动状态、描述所指事物的属性特征、表述所指事物的相对关系,也就是对所指的事物加以“说明”。这种语言符号串所表达的是“述谓概念”,也称为“运动类概念”

      2.指称概念(Nominal Concept)

      在认识客观世界时,人们指定这样的一种语言符号串来称呼所指的事物,也就是对所指事物给以“命名”。这种语言符号串所表达的是“指称概念”,也称为“事物类概念”。

      (二)事件(Event)

      “事件”是以一个述谓概念为“中枢”(Pivot),以一个或者多个相关的指称概念为“外围”(Periphery)的组合所反映的客观现实。一个事件形成一个简单的意合网络。

      语义平面上的术语“事件”可以是:1.一个“事实”(“李振华学电脑”),2.一个“描述”(“李振华很正直”),3.一个“判断”(“李振华是组长”)。

      (三)标记(Marker)

      语言所传递的信息包括客观信息和主观信息。主观信息包括信息传递者(说话者)对于客观世界的认识、视点、情绪、态度,以及交际的意图、愿望等等。

      “标记”是说话者传递语言信息时,在客观信息上所“标”明的主观信息的“记”号。“标记”本身不表示“概念”,因而不能单独占据意合网络的一个“节点”。

      1.关系标记(Relation Marker)如:与、或、被、把、因为、如果。

      2.依附标记(Attachment Marker)如:吗、呢、着、了、居然、果然。

      二 意合网络中的语义组合

      语义组合(Semantic Combination)是语义平面上的各种语义单位的组合,包括各种语义关系和语义依附。

      (一)语义角色(Semantic Role)是一个概念或事件在意合网络中的作用或地位。

      (二)语义关系(Semantic Relation)是由两个语义角色组成的“有序对”。

      1.对称关系(Symmetric Relation)是双方语义角色相同的组合关系。

      对称关系包括:(1)“并列”(2)“选择”(3)“同指”。

相关文章: