认知科学与机器翻译研究

作 者:

作者简介:
武斌,解放军外国语学院博士研究生/易绵竹,解放军外国语学院教授,博士,博士生导师。(河南洛阳 471003)

原文出处:
解放军外国语学院学报

内容提要:

第二次认知革命之后人们普遍认为,认知、思维等心理现象只不过是人利用语言和符号的结果,认知并不存在于个体内部,而是存在于人与人之间。第二次认知革命对机器翻译提出了新的要求,强调系统与人之间的“社会合作关系”。通过剖析由经验检验的优秀文本自动加工技术,并详细介绍俄罗斯“言语统计”研究组开发的新型机器翻译系统,不难发现,新一代机器翻译系统将朝着增强系统协同能力的方向发展。


期刊代号:H1
分类名称:语言文字学
复印期号:2007 年 11 期

字号:

      0.引言

      英国学者查罗纳(J.Challoner)指出,早期的认知科学建立在人脑是一台复杂的计算机这一理论认识基础之上,与人工智能的研究有着密切的联系;认知科学研究的是精神处理,研究我们如何思考和沟通以及如何指导行为,它可以理解为对人类思想的计算理论研究。(2003:29)可见,认知科学对语言自动翻译机的研发无疑具有先导作用。俄罗斯著名机器翻译研究专家皮奥特罗夫斯基(Р.Г.Пиотровский)认为,第二次认知革命的思想和基于行为的人工智能观极大地推动了语言自动机的研发,其实质就是将通信目标不断变化的动态模型引入每个文本自动处理系统中,模型类似于一个交际语用算子,控制着文本的生成与理解。(2002:17)随着第二次认知革命的发生和大量由经验检验的优秀文本自动处理技术的产生,一系列新型文本自动处理与机器翻译系统应运而生,机器翻译研究由此进入新的发展阶段,呈现出崭新的学科研究景观。本文将通过解析俄罗斯言语统计研究组(Исследователъская группа“Статистика речи”)设计并实现的语言自动机ЛИНГТОН系统,探讨认知科学对机器翻译研究的影响和作用。

      1.第二次认知革命与机器翻译

      20世纪六七十年代的认知与交际过程模糊性研究,其中包括对言语思维范畴的形成机制、信息学与诠释学(герменевтика)的产生机制的研究等,这些研究均取得了重大的理论成果。研究表明,自然语言中信息接受和处理的实际过程并不完全一致。个体与其所处的群体之间存在差异,其中每个成员都拥有自己的个人经验、世界观、文化财富、目标定向、潜在动机、身体组织和情感状态等内在因素,都在按照自己的意愿使用共同的思维空间。(Laszlo & Krippner,1998:65)与群体相比,个体的行为(包括言语行为)很少能严格按照预定的目标计划完成,经常会因为环境或主观评价的改变而发生变化。与人可以不断进行调整的适应能力(包括语言能力)不同,计算机系统按照预先写好的指令(程序)进行工作,每一步操作在文本自动处理系统的语言信息数据库中都要给出相应的解释(是或非)。

      第一次认知革命动摇了行为主义在西方心理学界的统治地位,导致了认知心理学的产生。第二次认知革命质疑认知心理学的基础假设——在千变万化的行为背后存在着一个普遍的、共同的和内在的认知机制,进而推动了社会建构论的产生。第一次认知革命是一次不彻底的革命,在许多方面承袭了行为主义的特点,它并没有把认知过程真正看成是积极的、能动的过程。相反,由于它要确立不受认知过程影响的客观真理,因而实际上贬低了认知过程的意义。如此一来,第二次认知革命的发生注定成为历史的必然。

      第二次认知革命是后现代主义革命,是对心理学中现代主义思潮的一次反动,它站在后经验主义立场上,对传统认知心理学有关存在一个一般性的认知机制的假设提出挑战,认为在人的头颅中除了大脑什么都没有,不存在一个精神性的中枢处理机制,而所谓的认知、思维等心理现象只不过是人利用语言和符号的结果。“我们会有一种认知心理学,但是这种认知心理学并不像传统的认知心理学那样考察抽象的计算装置运行过程,它研究的是各种各样的符号系统的意向性使用,意向性的使用是由积极的、主动的、处于公共或私下的情景的、且为完成各种任务或计划的人完成的,完成的过程往往是与他人协同作用的结果。”(Smith et al,1995:146)第二次认知革命的意义在于:认知过程被看作是人使用语言和话语的结果,而语言和话语是社会性的,是人际交流的产物,因此认知过程在其根本意义上首先是公开的和社会性的,其次才是私有的和个人的。从这个意义上讲,认知并不存在于个体的内部,而是存在于人际之间。因此,在设计和建造新的人工智能系统时,必须将20世纪六七十年代第一次认知革命期间取得的知识工程逻辑斯提技术与八九十年代第二次认知革命的建构主义思想结合起来。基于这种认识,专家们为能够在日常逻辑、情感、个人动机、语用学等领域建造计算机行为模型做了一些有益的尝试,但大多数人工智能专家对研究人类思维的计算机隐喻反应冷淡,更倾向于基于行为的人工智能观。

      应当看到,自然语言与计算机语言之间的障碍与二三十年前相比变得更加难以突破,有关“自然语言的历时性vs.计算机语言的共时性”“自然语言的模糊性和容限性vs.计算机语言的确定性和等价性”的悖论,也由于人与人工智能系统在言语生成和理解机制方面的巨大差异而变得愈益突出。无论现在还是未来,即使利用最好的计算机技术,也无法实现对个人动机、语用、情感的完全模板化及概念模拟。显然,问题的关键并不在于计算机技术发展到了一个什么样的程度。生物电子、微技术(包括微型机器人制造技术)、神经信息学等学科的飞速发展,数据处理技术的随之提高,为高性能计算机的批量生产奠定了坚实的基础。由于自身技术参数的优化,高性能计算机可以为行为智能系统的建造及其与人之间的“社会—伙伴”协作提供保障,但这些系统的实际运作均受两种因素的限制:1)缺少有关人的言语思维和交际活动的神经生理学机制和实用主义机制方面的详细实验数据;2)缺乏研究标准。针对这种现状,在研制新型文本自动处理系统和机器翻译系统时应当注意:1)依据第二次认知革命过程中形成的系统与人进行“社会—伙伴”协作的思想,在文本自动处理的全过程中加强译前、译中和译后编辑工作;2)不能过高期望人工智能系统、文本自动处理系统和机器翻译系统能带给我们高质量的译文,应当以通过消除模糊性快速提取文本信息为主要目标;3)在依靠传统计算机技术的同时,应将业已证明正确的方法与文本处理过程中出现的新方法相结合。

相关文章: