从语言工程看“中心扩展条件”和“并列条件”

作 者:

作者简介:
詹卫东,男,博士,北京大学中文系副教授,计算语言学研究所副所长,主要研究领域为现代汉语形式语法、语言知识工程、汉语词汇语义学、应用语言学等(北京 100871)。

原文出处:
语言科学

内容提要:

沈家煊先生近年来提出汉语词类包含模式,主要立论依据是传统的汉语词类体系中关于名、动、形等的处理方式有一个困境:要么违背语言学理论中的“中心扩展条件”、“并列条件”,要么违背理论构建时应该遵循的“简约”原则。如果采用词类包含模式去看待汉语词类,就可以摆脱这个困境。文章从树库语料的分析出发来说明语言事实中确实存在违反“中心扩展条件”和“并列条件”的情况,并将原因归结为言语使用中的“简约”(或“经济”)原则使然。换言之,言语交际中的简约,造成语言理论模型的无法简约。


期刊代号:H1
分类名称:语言文字学
复印期号:2013 年 02 期

字号:

      1 问题的提出

      汉语词类划分作为构建汉语语法体系的基础工作,长期以来却是困扰汉语语法研究者和中文信息处理研究者的一个大问题。下面通过一个例子说明主要问题之所在。

      (1)a.科学出版社非常迅速地出版了这本书。

      b.这本书的出版标志着我国思想界的进一步解放。

      c.这本书的封面显然是用中华书局的原版封面翻拍印制的。

      例(1)a中的“出版”是动词(v),没有争议,例(1)c中的“封面”是名词(n),也没有争议,例(1)b中的“出版”是什么词,在汉语语法学界则一直争议不断:是动词、名词,还是动名词、名动词?沈家煊(2007,2009a,2009b)提出汉语词类的包含模式理论,即汉语里的名词包含动词,动词包含形容词,因此例(1)b中的“出版”既是动词,也是名词。①

      沈先生的理由是:这样处理之后的语法理论既不违反“简约原则”,也不违反“扩展条件”(本文称为“中心扩展条件”)和“并列条件”。我们对此的质疑是:1)怎么知道(或评判)哪个理论更简约?理论的简约是一种主观感觉,还是有客观的评价标准?2)“中心扩展条件”、“并列条件”是否真的不能违反?沈先生的理论真的做到了既不违反“中心扩展条件”,又不违反“简约原则”吗?下面就来重新审视沈先生的词类包含模式理论的上述立论依据是否可靠,或者说沈先生提出的这种理论的好处是否真的存在。

      2 关于“简约原则”

      “简约原则”又称“奥卡姆剃刀(Ockham's Razor)原则”。这是被学术界普遍接受的一种观念,即所谓的“若无必要,勿增实体”。强调在竞争的两个理论中,如果理论的解释力相同,那么简单的那个理论胜出。这个观念很好理解,但是在具体操作层面,要比较两个理论哪个更简单,却绝对不是一件简单的事情。有时候直觉简单的理论,其实并不简单。下面举一个例子说明。

      “开飞机容易”、“打是疼,骂是爱”是汉语中合法的结构,其中句法结构的主语由“开飞机”、“打”、“骂”等“动词性成分”充任。如何描述这样的现象呢?理论甲的描述方法是提出两个假设:1)汉语中动词做谓语不做主宾语;2)动词做主宾语的时候变成了名词。理论乙的描述方法是提出一个假设:汉语中动词本来能做谓语也能做主宾语。那么,是不是能根据理论甲有两个假设,而理论乙只有一个假设,得出理论乙比理论甲简约的结论呢?

      答案是否定的。用自然语言描述的理论有时候会给人错觉,比如上面在对比理论甲和理论乙的时候,以为理论甲需要用到两条假设,而理论乙只需要用到一条假设。其实,要解释同样多的事实,理论乙需要的假设(规则)一点也不比理论甲少。如果用S代表句子,vp代表动词性成分(包括动词和动词短语),np代表名词性成分(包括名词和名词短语),那么,理论甲的两条假设对应的形式规则可以表达如下②(规则中的箭头可以解作“推导出”或“变为”。R1、R2、R'1、R'2等为规则编号,便于称说):

      (R1)S→np vp(说明:S变换为np+vp,np作主语,vp作谓语)

      (R2)np→ vp(说明:np变为vp,这样vp也就可以作主语了)

      同样的,理论乙的一条假设对应的形式规则其实也是两条:

      (R'1)S→np vp(说明:同R1)

      (R'2)S→vp vp(说明:S变换为vp+vp,第一个vp作主语,第二个vp作谓语)

      把自然语言表达的理论假设“翻译”成严格的形式文法后,就会发现,其实两种理论的规则条数是一样的,谁也不比谁“简约”。理论甲和理论乙都可以“解释”两种组合模式:“名+动”主谓结构(如“他+开飞机”)和“动+动”主谓结构(如“打+是疼”),但都无法解释汉语中的另一种组合模式“名+名”主谓结构(如“他+黄头发”)。要解释这种模式,按照理论甲的思路,仍然可以用两条规则来做到,同时还能解释原来可以解释的事实(前两种组合模式)。理论甲修改后得到如下新版本:

      (R1)S→np np(说明:S变换为np+np,第一个np作主语,第二个np作谓语)

      (R2)np→vp(说明:np变为vp,这样vp就既可以作主语也可以作谓语)

      但按照理论乙的思路,③要“解释”上述三种组合模式,就需要三条规则:

      (R'1)S→np vp

      (R'2)S→vp vp

      (R'3)S→np np

      那么,是否由此就可以认为理论甲比理论乙更简约呢?

      答案仍是否定的。因为理论甲虽然规则少,但它描述的事实也跟着就出问题了,它在能够解释三种主谓结构组合模式的同时,会产生一种新的错误组合模式:从R1和R2可以推导出S→vp np这样的组合。推导过程是:R1中的第一个np变换为vp,第二个np保持不变。这条规则会把“开+飞机”这样的述宾结构分析为主谓结构,而这显然不对。

      通过上面这个简单的示例,不难看到,要评判两个理论谁更简单,并不能诉诸直觉。事实上,在比较两个理论的复杂程度之前,我们得有办法评估一个理论能解释多少事实。只有满足了两个条件,才能客观评价两个理论的复杂程度:1)一个理论所能解释的事实多少是可以量化的;2)一个理论模型本身是可以计量的(可比较大小)。上面例子中理论甲和理论乙用自然语言表述的时候,是无法计量其大小的。

      直到上个世纪60-70年代,数学家和信息科学家才把诞生于14世纪的“奥卡姆剃刀原则”从一个抽象的观念变成了操作上可计算的算法(algorithm)。数学上用柯尔莫哥洛夫复杂度(Kolmogorov complexity)④这个概念来表达一个对象(比如负载了一定信息的字符串)的复杂程度。这个概念有一个别名是描述复杂度(descriptive complexity)。具体怎么定义这个复杂度呢?数学家想出的办法是用打印程序来模拟,即一个字符串的复杂程度,可以定义为打印出这个字符串所写的打印程序的长度。对同一个字符串,人们可以写出不同的打印程序来打印出这个字符串。这些打印程序就是解释该字符串的不同理论。这样,理论复杂度的比较问题,就转化为打印程序的长短比较问题。短的打印程序简单,长的打印程序复杂。那么,为什么同一个字符串,会有长短不同的打印程序呢?或者说,打印程序(理论)跟打印对象(字符串)之间的本质关系到底是什么呢?答案是,打印程序的本质是发现打印对象的规律,如果发现了字符串的规律,就可以把长的字符串压缩成更短的字符串(比如“010101010101”这个字符串可以表述为“6个01”,后者比前者缩短了)。这样一来,好的理论其实就是好的压缩程序,它可以把所描述对象压缩成更短的代码。而发现好的理论的前提是,我们能发现对象的内在规律。信息科学中用最短描述长度原则(minimum description length,MDL)来表达为一个对象发现最好的打印程序(或压缩程序)的算法。⑤至此,简约原则(或奥卡姆剃刀原则)才算是有了一个可操作的版本。那么,是不是什么理论都可以用上述办法来度量其复杂度呢?答案再次令人遗憾。有些描述对象太复杂了,比如自然语言,以至于要发现一个符合MDL的理论模型是不可能的。自然语言的句子理论上是无限多的,而且语言学家至今也没有实现用“有限规则生成无限个句子”的理想。⑥在自然语言信息处理领域,只能针对某个具体的语料库(即数量有限的句子集合),发现一个解释该语料库的MDL理论模型,但这个“好”的理论模型在处理其他的语料库(句子集合变了)时,很可能就成了一个表现糟糕的模型。

相关文章: