机器翻译中汉语动结式生成的过程和困难

作 者:

作者简介:
傅爱平 中国社会科学院语言研究所 100732

原文出处:
中国语文

内容提要:

动结式述补结构是汉语里很有特点的一种结构,在机器翻译中处理这种结构有很多困难。在外语译成汉语时,源语(例如英语)往往没有相当于汉语动结式的结构,也很难用转换规则把英语的某些结构形式与汉语动结式联系起来。所以除非用个别处理的办法,目前的机器翻译系统很难生成汉语的动结式译文。 要让机器翻译系统有生成动结式的能力,需要识别源语句子要表达的意思,根据意义表达的要求,选择汉语词语,确定动结式的语义关系和结构形式,最后生成句子的表层。汉语句法和语义研究是生成动结式的基础。本文试图从这个角度说明动结式的生成过程以及要解决的问题,通过个例观察动词和结果补语之间在语义上的组合情况,着重讨论一种根据组成成分之间的语义关系选择句法结构的方法。希望能够说明机器翻译对汉语研究的一些需要。


期刊代号:H1
分类名称:语言文字学
复印期号:2003 年 05 期

关 键 词:

字号:

      1.引言

      当电子计算机1946年问世的时候,人们就提出了机器翻译的想法,并且在1954年进行了第一次机器翻译试验。然而与后来的各种语言信息处理研究和应用(语言信息检索、文本自动分类、自动文摘、信息提取等等)相比,机器翻译却是进展最慢的。学者们倾其大半生精力、商家投入为数可观的资金,经历五十多年不懈的研究和开发,得到的成果或者产品却常常不能令人满意。

      原因是什么呢?从语言研究的角度来说,机器翻译系统分析、理解和生成自然语言的能力都还不到位,处理不了的语言现象很多:有的是句子结构层次弄错了,有的是结构关系弄错了,有的是成分之间的语义关系弄错了,有的是词义辨识错了,还有的错误是源语和目标语之间的对比差异造成的。下面是机器翻译处理汉语动结式不成功的几个例子(来自三个机器翻译系统)。

      先看生成的情况,机器翻译目前还很难生成汉语的动结式,所以我们很少在汉语译文里见到含有动结式的句子。对于下面这个英译汉的例子,三个系统都不能翻译成“他把地扫干净了”:

      He swept the floor clean.  * 他干净地扫地了。

        * 他清扫清洁的地板。

        * 他清扫地板干净。

      再看汉语动结式翻译成英语的例子,它们可以说明目前机器翻译系统分析和理解汉语动结式的能力:

      他踢坏了三双鞋。 *He plays three pairs of evil shoes.

       *He kicked three pairs of shoes bad.

       *Him kick spoil 3 pairs of shoes.

      这段路把妈妈走累了。*The way make mother tired after the walk.

         *This section of way was walked mother tired(ly).

       *This road mother walk tired.

      大家吃腻了剩菜。*Everybody has fedded up with the leftovers.

         *That everybody ate greasy(ly)surplus vegetable.

      

      *All eat,is loathe to leave vegetable.

      下面我们只讨论动结式的生成问题,其中不包括以下三种情况:1)补语用“得”字连接的;2)补语虚化的,如:“抓住”、“买着”、“看完”、“办成”等;3)补语和动结式的宾语有固定搭配关系的,如:“说走了板”、“看愣了神”、“苦出了头”等等。

      2.机器翻译中的动结式问题

      为了说明机器翻译如何处理动结式述语结构,我们需要先看看机器翻译的过程。下图说明了机器翻译的原理,也是机器翻译的整个过程。

      

      图1 机器翻译的过程

      显然,这是一个理想化的机器翻译过程。从S到I再到T的过程是中介语言的翻译策略,中介语言通常是某种独立于源语和目标语的逻辑表达式。如果是英译汉,对英语的分析和理解要从表层深入到底层,得到描述句子意义的中介语言逻辑表达式。同样地,汉语也要从底层到表层一步一步生成。分析时从表层到底层走得越深,生成时从底层回到表层的过程也就越复杂。因此,需要分别对这两种语言的句法和语义系统作深入的研究。实际上目前大部分机器翻译系统都作不到这个程度,常见的翻译策略是直接法或转换法,或直接和转换相结合的混合方法。我们可以通过一个英译汉的例子对直接法、转换法和中介语言法这三种翻译策略作一个比较:

      You get good reception on your radio.(摘自某产品说明书)

      译句1 你得到好的接收在你的收音机上。

      译句2 你用你的收音机得到好的接收。

      译句3 你的收音机接收情况良好。

      在机器翻译系统中,用直接法可以得到译句1;用基于句法的转换法,再加上一些语义关系的分析,能得到译句2;译句3是基于理解的,用中介语言法有可能作到。显然,前一节关于动结式英译汉和汉译英的例子,都不是基于理解的翻译。

      动结式的结构形式简洁,语义关系复杂,在汉语里是很有特点的一种结构。吕叔湘先生(1986)曾用它说明汉语句法的灵活性。人们在从各种角度论述动结式述补结构的时候,常常会提到它在对外汉语教学当中是个难点。同样,在机器翻译中它也是个难题。在汉语翻译成外语的系统里,难的是如何分析和理解动结式述补结构。在外语翻译成汉语的系统里,难的是如何生成含有动结式的句子。

      我们在这里只讨论生成的情况。在这种情况下,源语(例如英语)往往没有相当于汉语动结式的结构形式,也很难用转换规则把英语的某些结构形式与汉语动结式联系起来。所以除非用个别处理的办法,采用直接法和转换法翻译策略的系统很难生成汉语的动结式译文。要让系统有生成动结式的能力,就要按中介语言法的思路,增加分析的深度,理解源语句子要表达的意思(各个成分的概念意义、成分之间的关系意义,句子的句式意义,等等),然后根据意义表达的需要,选择动结式的一种结构形式,再生成表层的句子。目前我们对汉语的研究还不足以支持这样的生成过程。所以在现有的机器翻译系统输出的汉语译文当中,很难找到地道的含有动结式述补结构的句子。于是就有了下面的译文:

相关文章: