提要 从认知科学的角度讨论人类的认知过程和自然语言理解之间的关系,展示人工智能中的知识表示和语言学中的语法描述之间的互动作用,提出语言知识的形式表示和语言的计算分析的有关步骤,尝试建立一种语言的认知研究和计算分析相结合的研究范式,最后介绍这项研究的理论背景并展望这种研究的应用前景。 一 认知过程和语言理解 认知(cognition)是人脑最高级的信息处理过程(information—processing),它贯穿于问题求解(problemsolving)、 概念形成(concept—forming)和语言理解(language—understanding)等最复杂的人类行为中。认知活动最本质的特点是利用知识来指导人们当前的注意和行为,它涉及:1.信息的获取(acquisition)、表征(representation)并转化为知识,2.知识的记忆(存贮和提取),3.运用知识进行推理等心理过程。对于语言理解来说,认知过程的主要环节是语义的记忆和利用知识进行语义推导,从而从语言形式上获得正确的语义解释(semantic interpretation)。例如:
从理论上讲,(1)(2)都可能有a、b两种语义解释,但在通常的情况下,(1)只能理解为(1a),(2)只能理解为(2b)。反过来,从语言生成的角度看,(3a)(4b)可以省略为(3a’)(4b’),但(3b)(4a)不能省略为(3b’)(4a’)。这种语义理解和成分省略上的不平行性,只能从语义记忆和语义推导的方式上去寻找合理的解释。 袁毓林(1994)尝试从认知的角度,用扩散性激活的语义记忆模型和非单调推理的逻辑机制来解释例(1)~(4)这类现象。根据认知心理学的研究,意义的心智表达(mental representation )是概念网络,调用一个词项的意义可以激活知识网络上一大片相关的语义节点。比如,听到名词“酒”可以激活[液体、饮料、刺激性的味儿、颜色……]等一组语义,听到名词“花”可以激活[植物的器官、观赏性的颜色、味儿……]等一组语义,听到形容词“淡”可以激活[(味儿、颜色)不浓、(含量)稀薄、(态度)不热情……]等一组意义。人们根据常识推断,酒作为一种有特别味道的饮料,[味儿]是它的强特征,“酒淡”可以直接理解为“酒的味儿淡”;如要表达“酒的颜色淡”,属性名词“颜色”不可省去。同理,花作为一种有特别颜色的植物器官,[颜色]是它的强特征,“花淡”可以直接理解为“花的颜色淡”;如要表达“花的味儿淡”,属性名词“味儿”不可省去。 这种推理方式叫缺省推理(reasoning by default),大意是:除非特别说明,可以默认某一命题总是成立的。如,在没有特别指明时,人们可以断定鸟总是会飞的,除非说话人特别声明这只鸟是企鹅或驼鸟。缺省推理是非单调逻辑的一种,计算机科学研究者已对此作了大量讨论,并做了形式化工作。〔1 〕通过缺省来表示默认已成为人类语言交际时信息编码和译码的一种基本的约定,如:说起“部长、强人、工程师”时,听话人可以推断他们是男性;因为听话人相信,如是女性,说话人一定会特别声明。因此,语言中有“女部长、女强人、女工程师……”一类说法。 我们希望用扩散性激活的语义记忆模型和缺省推理的非单调逻辑来建立一种语言理解的微观机制,用以解释同一句子中不同词项之间的语义联结和制约关系;并籍此揭示人脑处理语言信息的某种心理过程,从而为认知心理学和计算机理解自然语言提供强有力的语言学支持。 二 知识表示和语法描写 由于知识在人类认知活动中的重要作用,因而在研究计算机模拟人类智力活动的人工智能学科中形成了一个专门的研究领域——知识工程(Knowledge engineering), 其任务是从人类专家那里抽取他在严格限定的具体领域里所拥有的专门知识(expertise), 并把这些知识表示成一个巨大的关于某个具体领域的规则集合,以建立所谓的专家系统(expert system),如肝炎诊断系统、气象预报系统等。 因为人工智能问题的求解是以知识为基础的,无论应用人工智能技术解决什么问题,首先碰到的就是所涉及的各类知识如何加以表示,即如何将已获得的有关知识以计算机可以识别的形式加以合理地描述、存贮,这就是所谓的知识表示(Knowledge representation)。合理的知识表示可使问题的求解变得容易,并有较高的求解效率。 为了提高计算效率,人工智能研究者一直致力于寻找获取和表示知识的最好的方法。从广义上讲,一个表示方法就是一个按照某些约定把字符组织起来的词汇表。现在已发展得比较成熟的知识表示方法有以下几种:〔2〕 (1)通过引入谓词、函数来加以形式描述的逻辑表示法。例如: TABLE(A)表示A是桌子 EMPTYHANDED(ROBOT)表示机器人双手是空的 AT(ROBOT,A)表示机器人在A旁 HOLDS(ROBOT,BOX) 表示机器人拿着积木块 在这种知识表示下,计算机可采用归结法(resolution)或其他方法进行正确的推理。