近年来,语码转换已经成为最受研究关注的语言接触现象之一(Myers-Scotton,2006)。语码转换指“从话语(discourse)到小句(clause)层面包括两种或两种以上语言变体的语言运用”(Jake&Myers-Scotton,2009:207),它是复杂的语言现象,受到社会、语言和心理等因素的制约(李经纬陈立平,2004),对于经验、人际和语篇功能的表达具有重要作用(王瑾,2007)。由于语言接触所引起的结构变化一直是语码转换研究的热点之一(Croft,2000;Johanson,2002;Thomason,2001;Backus,2005)。Jakobson等(1952)预测到语码的转换会加大语言解码的难度。但是,目前为止,基于真实语料对语码转换进行定量句法及认知加工的研究为数极少。 根据依存语法(Hudson,1995;Hiranuma,1998,1999)和认知科学的研究(Gibson,1998,2000),依存距离(dependency distance,以下简称为DD)是语言依存结构的重要特征(Temperley,2007;Liu,2008;Gildae & Temperley,2010),它可以有效地测量句法的复杂度并且反映语言加工的难度。Gibson(1998)研究表明:支配词和从属词之间的距离越长,加工难度越大。平均依存距离(mean dependency distance,以下简称MDD)不仅可以对比不同句法的加工难度(Hsiao & Gibson,2003;Liu,2008),还可以研究不同语言的加工难度(Liu,2008)。Liu(2008)通过计算20种语言的平均依存距离发现:依存距离是语言理解难度的测量标准,不同语言具有不同的依存距离,汉语的MDD至少是英语的两倍。换言之,依存距离是一项具有句法和认知双重特征的指标,通过测量依存距离,我们既可以发现语言结构的变异(syntactic variation)又能够推知加工难度的差异。依存距离以依存关系为基础。依存关系是在真实语境中实现的词与词之间的配价关系。配价是词的一种属性,是词与词结合的一种潜力,这种潜力在句法层面得以实现(刘海涛,2009)。根据配价理论或依存语法(刘海涛,2009),动词是句子结构的中心,它是句子中级别最高的支配成分。因此,如果观察动词在真实语料中的配价,观察动词支配不同词类的分布以及依存距离的变化,我们有可能发现语码转换句法变异的深层原因。Eppler(2011)在德英语码转换语料库中发现了不同依存关系中依存距离的差异,Wang和Liu(2013)在汉英语码转换的语料库中也发现了以依存距离和依存方向为测量指标的句法变异,并从句法分布的层面解释了原因。为了探究引起汉英语码转换依存距离变异的深层理据,本文以动词的句法配价为切入点考察补充关系中的主语、宾语关系和说明关系中的状语关系,主要回答以下问题: (1)动词支配的主语、宾语和状语关系在依存距离的变异中发挥什么作用? (2)汉语动词和英语动词分别支配哪些词类形成主语、宾语和状语关系?它们的概率分布和依存距离对汉英语码转换的句法变异发挥什么作用? 2.理论基础 词语法(Hudson,2010)和概率配价模式理论(刘海涛冯志伟,2007)是本研究的理论基础。根据词语法,即以词汇为基础的依存语法,词汇是句法分析的基础,动词是句子的中心;句法结构全部由词与词之间构成的依存关系组成;每一个传统意义上的句法关系构成一个依存关系。依存关系是不对称的,即在关系的两个语言单位中,一个为支配词,另一个为从属词(刘海涛,2009)。例如句子“他是一个good boy”的依存关系分析如图1所示。 例1:他是一个good boy。
图1中所有的词都通过某种语法关系联结,文字上方的字母表示词性,文字下方的数字表示依存距离;从支配词(head)到从属词(dependent)的有向弧表明两个语言单位之间的关系是不对称的;有向弧的顶端是两个词之间的依存关系。例如:支配词“是”和从属词“他”之间的依存关系为“主语”(Subj),“个”和“一”之间的依存关系为“量词补足语”(QC)。“依存距离”这一术语是由Hudson(1995)首先引入的;它指支配词和从属词之间的线性距离(Liu et al.,2009)。研究表明,依存距离与工作记忆的承载(the working memory load)、句法加工复杂度(parsing complexity)甚至儿童语言习得机制有关(Ninio,1998;Hiranuma,1999;Liu et al.,2009)。 配价理论是一种有关词的句法—语义理论(Tesnière,1959;Hudson,2004)。配价理论也是一种面向应用的语言学理论,它可以有效地描述一个词或词类的结合力。刘海涛和冯志伟(2007:35)提出了自然语言处理的概率配价模式理论:“当描述一个词或词类的配价时,不仅应该用定性的方式来描述它可支配什么样的依存关系,可以受什么样的依存关系的支配,而且也应该用定量的方式给出这些依存关系的权重或概率分布,如名词作主语的概率是多少,作宾语的概率又是多少等等”。因此,词类的概率配价能够反映词类的句法功能分布和语言的结构特征。本研究采用广义的配价理论,依存关系既包括补充关系(主语和宾语等)又包括说明关系(状语等)。