现代汉语历时变化特征研究:结构复杂度

作者简介:
秦洪武,曲阜师范大学外国语学院教授,博士,研究方向:语料库语言学,语言对比与翻译,文化海外传播,E-mail:qinhongwu@163.com;周霞,曲阜师范大学文学院博士生,研究方向:对比语言学;孔蕾,曲阜师范大学外国语学院教授,博士,研究方向:语言对比与翻译,文化海外传播,外语教学(山东 曲阜 273165)。

原文出处:
外语与外语教学

内容提要:

本文基于现代汉语历时语料库,通过历时比较描述现代汉语结构复杂度百年演化特征,观察复杂度变化与句段长度的关系,并从类联接和依存距离两个可计量维度考察结构复杂度变化的内部成因。研究发现:(1)汉语结构复杂度在过去百年总体呈上升趋势,快速变化多出现在1920-1940年代;(2)结构复杂度表现出文体差异:小说文本历时变化幅度微小,学术文本变化幅度最大;(3)句段长度与结构复杂度变化轨迹相近,前者能够较好地预测后者;(4)类联接历时分析显示,部分含有副词的类联接构成的句段复杂度低,多在文学作品中用作话语标记;而含有助词“的”的类联接多用作修饰成分用于构建复杂的结构,多出现在学术文本中;(5)以依存距离表达的结构复杂度呈现历时增长,增幅最大的依旧是学术文本。研究认为,依据口语、书面语二分法来比较现代汉语历时变化具有合理性,但还需系统反映书面语内部体裁间的差异,本研究将这种差异表达为历时变化幅度层级:学术文本>通用文本>新闻文本>小说文本。


期刊代号:H1
分类名称:语言文字学
复印期号:2023 年 01 期

字号:

      现代汉语的发展与成形始于五四时期“躲文言,亲口语”(张中行2007:278)的文学革命,在1930年前后达到成熟(张中行2007:280)。一般认为,现代汉语历时变化是语法变化,主要涉及词法和句法两个层面(朱德熙1982:25),包括词汇变化(新词、动词“要”“是”、副词“其实”“十分”、介词“给”“到”等的语法化)、结构变化(动补结构、比较句以及汉语特殊句式等)和语法系统演变(汉语的否定系统、方位系统、助词及体标记等)(如崔山佳2013;方梅2005;沈家煊1998;石毓智、李讷2000;张谊生2000)。汉语学界也尝试建立反映汉语语言特征的语法化理论,探索汉语语法化机制及演变规律(如刘丹青2001;沈家煊1998;吴福祥2004)。另外,翻译语言对现代汉语的影响(欧化)(王力2011:335;张中行2007:285)已成学界共识,已有不少研究关注翻译对现当代汉语的影响(如王克非、秦洪武2017;夏云、秦洪武2017;朱一凡2018),但主要聚焦五四时期(1920年前后)至20世纪30年代的文本,现代汉语在20世纪30年代以后的变化较少进入研究视野。

      长期以来,汉语演化研究多注重观察特定语言项使用的变化,极少关注语言演化的系统性,缺少对汉语演化特征的整体描述。此外,汉语历时演变研究一般考察记叙文本,体裁单一,范围受限,缺少文体和体裁平衡的历时语料支撑,无法多层次反映现代汉语变化的样貌。鉴于此,本研究使用历时平衡语料,尝试基于词性和句法标注从多个侧面描述现代汉语结构复杂度的历时变化。

      2.结构复杂度和相关概念

      本研究基于历时平衡语料库,采用描写性研究方法,探索现代汉语结构复杂度历时变化特征,选择影响汉语结构复杂度的词性和句法结构设置主要变量。除了采用秦洪武和孔蕾(2018)提出的汉语结构复杂度计算方法描述现代汉语的变化趋势,本研究还把与汉语结构复杂度密切相关的句段长度单独列为观察对象,观察句段长度对汉语结构复杂度的预测力。为进一步揭示结构复杂度变化的内在原因,研究还观察和分析了两种影响复杂度的内部构成因素:类联接型式和依存距离。此外,学界在观察现代汉语历时变化时,传统上只作口笔语区分,书面语内部可能存在的差异长期未得到重视。为弥补这一不足,本研究基于体裁分类观察结构复杂度变化,尝试对汉语历时变化作出更精细的刻画。

      2.1 汉语结构复杂度

      句法复杂程度(syntactic complexity)与心理学上的认知复杂性有关联(Givón 1998:10)。同等情况下,句子越长结构越复杂,读者付出的处理努力就可能越大,可读性因之越低。根据Kintsch(1998)的分析,词汇数量是反映概念复杂度的指数,句子越长,就越有可能嵌入多重离散的概念/命题。表现为字符串长度的句子长度在语言表层最直观,也最容易计数。同时,容量本身也是可读性的重要参数。一般说来,字符串越长,占用的工作记忆就越多,语言使用者所付出的处理努力也就越多。本研究认为,除了词汇数量,句法复杂度还受其他因素影响,如特定结构内部的构成。对结构封闭的汉语而言,若结构内部修饰成分多或内嵌式成分、小句性修饰语混合使用,结构也会变得复杂,处理难度增大,对可读性或影响。鉴于此,本研究在计量结构复杂度时兼顾词的数量和结构内部构成。由于影响结构复杂度的因素众多,本文只关注四个主要因素:结构封闭性、句段长度、类联接和依存距离(封闭结构的容量)。

      2.2 相关概念

      2.2.1 汉语结构的封闭性

      汉语缺少修饰、限定成分后置的语法手段,基本结构不允许向右扩展,属于结构封闭的语言。“介词-方位词”“数量短语-名词”“动词-宾语”“指示代词-名词”“形容词-名词”等结构右边的词为结构终点,修饰成分只能置于被修饰成分之前,导致汉语结构对容量敏感,结构容纳的词汇数量有限(秦洪武2010)。已有研究发现,结构容量内部构成复杂,中心词之前修饰成分过多是导致汉语结构复杂的主要原因(秦洪武2010;秦洪武、孔蕾2018;王克非、秦洪武2017)。通常情况下,封闭结构内部的前置修饰成分短小且数量少;使用多个修饰成分时,一般会使用平行结构以降低处理难度;若修饰成分多,结构不平行,甚至混有小句式定语,则会破坏读者期待的阅读节奏,迫使读者采用基于记忆的理解策略付出更多认知努力(秦洪武、孔蕾2018)。汉语结构的封闭性使结构内部容量和构成的计量成为可能,基于词数、各类小句数量以及封闭结构从属小句数量、内嵌小句数量和修饰成分数量可综合计算出汉语的句法复杂度(秦洪武、孔蕾2018)。

      2.2.2 句段长度

      在汉语里,句段是一种独特的存在。它包含流水句式(连谓句),也包含其他句子片段;它可以是单个句子,也可以是短语,更像是赵元任和沈家煊所说的“零句”(沈家煊2012)。汉语句段切分且用于计数的标志除句子标记外还有逗号和冒号。句段长度不等于结构复杂度,但二者紧密关联。首先,句段之间的显性连接是结构复杂度的指标(逻辑连接词);其次,封闭结构包含在句段之中,结构复杂度和句段长度必然关联:句段长度相同时,句段内含的封闭结构容量越大复杂度越高,封闭结构中内嵌小句或非平行表达形式越多复杂度越高。修饰成分、内嵌成分或小句性修饰语混合使用会产生大容量结构和内部复杂的长句段,导致认知处理困难。这说明,句段长度可以作为判断结构复杂度的重要关联变量。鉴于此,本研究在描述汉语结构复杂度历时变化时,将句段长度一并纳入考察范围。

      2.2.3 类联接

      结构复杂度成因复杂,需要综合考察多种变量方能对其进行有意义的分析。汉语封闭结构对容量敏感,仅凭词数难以真正反映结构的复杂度,需考察结构内部构成以达成合理判断。鉴于词性间的线性关系可产生有规律的句法组合,可以从词性组合方式上(类联接)分析汉语结构复杂度变化的原因。学界对类联接认识不同,可以指词与词在语法范畴之间的关系(Firth 1957:181),即在词汇类别上的组合关系,也可指词形或句法上促使语言因素之间相互结合的条件(Bussmann 2000:81)。本研究中汉语语法层面的类联接仅指词类间的线性组合。类联接的历时变化,以及特定类联接与结构复杂度之间的关系,是本研究考察和分析的重点内容。

相关文章: