寻找机器翻译痕迹  

作 者:

作者简介:
沈梦菲,黄伟,北京语言大学语言科学院计量语言学研究中心(北京 100083)。

原文出处:
外语教学与研究

内容提要:

神经机器翻译日趋成熟,但译文还会带有“机器翻译痕迹”,如译文难以理解、语言不够地道等。现有研究尚不明确“机器翻译痕迹”的语言学表现,尤其对机翻译本的深层句法特征了解甚少。本研究自建人工译本与神经网络机翻译本依存树库,使用依存距离、依存方向等指标对比英译汉方向人、机译本的句法特征。研究发现,神经机器翻译系统对长句的句法复杂度控制不足,表现在对被动结构和介词短语的翻译不够地道,相关结构和短语可能会增加译文的理解难度;机翻译本中的状中、右附加、介宾等依存关系的使用遗留了英语对名词性结构的使用倾向,这导致人、机译本在语序分布上也存在差异。本研究在句法层面捕捉到的这些“机器翻译痕迹”,对评估翻译质量和译后编辑等具有一定参考价值。


期刊代号:H1
分类名称:语言文字学
复印期号:2024 年 09 期

字号:

      1.研究背景

      语言翻译是一项古老且复杂的人类智能活动,而在信息时代机器翻译已成为打破语言壁垒的有力手段。自神经机器翻译技术取得突破性进展以来,机器翻译质量明显提升。尽管生成式人工智能可能带来机器翻译技术的巨大变革,但是目前ChatGPT机器翻译水平与未使用生成式预训练模型的神经机器翻译不相上下(冯志伟、张灯柯2024)。近年来,神经机器翻译的质量已经接近人工翻译(Hassan et al.2018),但整体而言,人、机译本仍存在诸多差异(梁君英、刘益光2023)。这与人们日常的阅读体验基本一致,即读者有时会感觉到某些译文“机器翻译痕迹”严重,推测文本主要是由机器而非人工所译。那么,什么是“机器翻译痕迹”呢?要回答这一问题,有必要考察神经机器翻译系统产出文本的语言特征。

      本文讨论的“机器翻译痕迹”不是显而易见的词汇或语法错误,而是区别于人工翻译的潜在风格特点,例如译文语言拗口(awkward)、不够地道(unidiomatic)等。这些风格特点不仅影响阅读体验,也是译后编辑中消耗译者注意资源的主要因素(钱家骏等2022)。

      机器翻译和人工翻译文本在语言风格上的差异已经引起研究者的关注。语言风格与语言单位的使用频率有关(黄伟、刘海涛2009)。在英译汉方向上,与人工译本相比,机翻译本中助词、介词、连词等虚词以及代词的使用频率较高,副词、惯用语、感叹句的使用频率较低,这说明机翻译本中“虚词明晰化”“代词显化”等翻译文本的风格特征更加明显,导致译文的连贯性、可读性及语言的地道程度降低,情感表达能力也有所欠缺(蒋跃2014;韩红建、蒋跃2016)。除了语言单位的使用频率以外,Vanmassenhove,Shterionov & Way(2019)、Vanmassenhove,Shterionov & Gwilliam(2021)还使用类符/形符比(TTR)、词频概貌(lexical frequency profile)、香农熵(Shannon Entropy)和辛普森多样性指数(Simpson's Diversity Index)等语言指标进行研究,发现各类机器翻译系统的译本与人工译本相比,都存在词汇和形态丰富性损失的问题。因此机器翻译语言(machine translationese)被认为是一种“人造的贫乏语言”。造成贫乏的主要原因被认为是“算法偏见”(algorithmic bias),即翻译系统更倾向于学习和使用训练语料中高频出现的语言结构,而容易忽视低频结构(De Clercq et al.2021)。上述研究基于显性语言特征揭示了人、机译本在语言风格上的差异,但是尚未涉及太多深层语言结构的特点。

      近年来,已有研究尝试考察机翻译本的深层句法特征,主要采用平均依存距离(Mean Dependency Distance,MDD)对比人、机译本整体的句法复杂度(Liu,Xu & Liang 2017)。Bizzoni et al.(2020)基于不同体裁和翻译方向的人、机译本,发现统计机器翻译文本的MDD小于人工翻译,而神经机器翻译文本的MDD接近甚至超过了人工翻译。但是,刘益光(2021)对比了人、机口译间英语译人语的MDD,发现它们在句法层面无显著差异。那么,机翻译本在深层句法结构方面究竟是否与人工译本存在差异,从而导致其理解困难、不够地道呢?

      为了探讨这个问题,本研究构建了“人、机翻译依存树库”,借助句法计量指标,对比分析两种译本的句法特征,寻找“机器翻译痕迹”在句法层面的语言学表现。本研究使用的百度和谷歌翻译是在国内外应用广泛的神经机器翻译工具,能够在一定程度上代表现阶段机器翻译的特点。在计量指标的选择方面,依存距离最小化(Dependency Distance Minimization)在人类语言中具有普适性(Liu 2008;Futrell,Mahowald & Gibson 2015),基于依存方向(dependency direction)的“刘-有向性”(Liu-directionalities)指标及方法已经成为一种探索句法参数的新方法和先进的现代语言类型学方法(参见Liu 2010;阎建玮、刘海涛2023)。这些存在于人类语言中的句法规律已经得到语言学和自然语言处理领域的重视,依存距离和依存方向相关指标在机器翻译质量评估(Peng,Hao & Fang 2021)以及翻译语言研究(Fan & Jiang 2019;范璐、蒋跃2024)中也得到了广泛认可和实际应用。据此本研究分别采用MDD和依存方向占比作为测量句法复杂度和语序分布的指标。

      具体来说,本文探讨以下两个问题:1)神经机器翻译文本与人工翻译文本在句法复杂度和语序分布方面是否存在差异?2)如果存在上述差异,那么造成这些差异的原因是什么?对这两个问题的解答,不仅有助于深入了解神经机器翻译语言在句法层面的特点及其成因,对机器翻译质量评估、译后编辑等也具有一定的借鉴意义。

      2.研究设计

      2.1 语料来源与句法标注

      一般认为,通用型机器翻译系统在信息类文本上的表现优于文学类文本。本研究以牛津大学历史学博士赫拉利(Y.Harari)的社会科学领域科普读物《人类简史:从动物到上帝》(Sapiens:A Brief History of Humankind)作为研究材料,构建了人工翻译、百度翻译、谷歌翻译三个译本。人工译本选用中国台湾翻译家林俊宏的汉译本第1版。该译本语言风格“生动晓畅”(高毅2015),曾获吴大猷科学普及著作奖之翻译类金签奖等殊荣。机翻译本则通过手动操作或API接口获得,分别由百度、谷歌两个在线翻译系统翻译而成。为了将统计样本控制在相近的长度,以译本中最短章节的词数为基准,将人、机译本均拆分成若干个2,000词左右的样本(不含译注等信息)。三组样本均进行段落对齐,样本数及样本的平均词数、词种数如表1所示。

相关文章: