1992年6月,国家汉浯水平考试委员会办公室考试中心制定的《汉浯水平词汇与汉字等级大纲》正式颁布。10年来,它为我国汉语水平考试的开发和教材编写提供了明确的依据和规范,在对外汉语教学领域发挥了巨大的作用。为使之更臻完善,最近有关部门正组织力量对其进行补充修订。我们认为,这是一项意义十分重大的工程,同时也是一件非常艰苦复杂的工作,应当得到对外汉浯教学界的广泛关注与支持。为此,我们谨就《(汉语水平)词汇等级大纲》(以下简称《大纲》的修订谈一些不成熟的思考,希望能对这项工作有点滴帮助。 一 《大纲》的修订目标与先决条件 要在哪些方面对现行《大纲》加以改进?修订《大纲》的预期目标是什么?我们应当从《大纲》的性质、编制依据和用途出发来考虑这些问题。 《(汉语水平)词汇等级大纲》“不同于一般的教学大纲.而是一种规范性的水平大纲。”(刘英林、宋绍周,1992)其性质决定了《大纲》的编制必须以词语的使用频度为原则,用使用频度来衡量词语的常用程度,以进行词语筛选和确定词语的等级。因此,《大纲》编制者主要选取北京语言学院的《现代汉语频率词典》(以下简称《频率词典》)和刘源等编《现代汉语常用词词频词典》(以下简称《词频词典》等7种词(字)频统计成果作为定量分析的依据,获取词语频度的基本数据。这些词频统计在当时水平较高、影响较大,可是作为编制《大纲》的依据,却远不够理想,主要有以下几点缺欠: 第一,用于词频统计的语料在数量、范围和语体等方面都多有局限,这影响了一些词语频率指数的可靠性。比如,《词频词典》选用语料2500万字,其中“米饭”和“主义”的词次之比是25∶4161;《频率词典》选用语料180万字,其中“米饭”一词未出现,而“主义”的词次高达3782次,在使用度最高的词中排在第54位。这些数据显然与两词在汉语社团现实生活中真实的使用频率相去甚远。 第二,未能划清字词界限,多把同形词作为一个单位进行词频统计。《词频词典》这方面的问题最为严重,不仅未能区分同音同形词,还把读音不同的同形词合在一起进行统计,例如: 背(bēi,bèi) 笼(lóng,lǒng) 华(huá,huà) 白干(báigàn,báigānr) 拆散(chāisǎn,chāisàn) 废物(fèiwù,fèiwu) 结果(jēiguǒ,jiéguǒ) 门道(méndào,méndao) 下水(xiàshuǐ,xàishui) 《频率词典》在这方面做得较好,将异音同形词全部分立,但仍未能完全区分同音同形词,例如:杜鹃(a.鸟名;b.植物名)、豁(a.~了一个口子;b.~出三天工夫)、搀(a.~着奶奶;b.~点水)等,都是把两个词合在一起统计。由于词频词典在一定程度上是以形为准进行统计,就使得用字相同的词的使用频率未能得到清晰的反映。 第三,未能细致地统计多义词在不同义项、兼类词在不同词性上的使用频率。只有《频率词典》对部分兼类词是分词性统计词频的,但这一原则并未用于所有的词,例如“孤立”、“冷落”未区分形容词和动词词性,“组织”、“注释”未区分动词和名词词性,“还是”未区分副词词性和连词词性。 现有词频统计的这些缺欠,都在不同程度上给《大纲》的编制和修订带来了困难。
表中的A类词是政论性文体中的高频词,B类词是生活性语体中的高频词,如果真按它们的等级序列编写教材,势必会使
学习者硬学一些用不着或极少用到的词,而交际需要的词又一时学不到,从而影响学习效率和积极性。 第二点缺欠导致同形词各方的词频都没有确定的数据。比如《词频词典》“结果(jiēguǒ,jiéguǒ)”的频度(词次)为4635,然而这一种写法、两种读音实际上代表了4个词语(注:在《现代汉语词典》中,“【结果】1”和“【结果】2”属同一个词。此据《大纲》分立。): 【结果】jiē∥guǒ:长出果实。 【结果】1jiéguǒ:(名词)成就,成果。 【结果】2jiéguǒ:(连词)用在表过程或原因的分句后,引出事物发展的最后状态。 【结果】3jiéguǒ:将人杀死。 把这4个词合在一起进行统汁所得出的数据,对于《大纲》编制来说毫无意义。因为无法从4个词的词频之和中获知每一个词的词频状况。 相比较而言,第三点缺欠对《大纲》编制的不利影响更大、更深刻。《大纲》所列8000余词是汉浯常用词,其多义现象十分突出,因为词的常用性与多义性是成正比的;加之汉浯由于缺乏词形标记,词的兼类现象又很普遍,因此词的多个义项往往又与其不同的词性相关。对于多义词和兼类词来说,其在不同义项和不同词性上的使用频率(以下分别简称“义频”和“类频”)往往是有差异的。现有的词频统计都是以词为单位进行统计,对一个词在何种意义上使用不予考虑,只有个别词频统计有限地区分了兼类词在不同词性上的使用频率。依据这类粗疏的词频统计结果,《大纲》只能以词为单位进行等级排列,而不能细致地定出多义词不同义项的等级和兼类词不同词性的等级。这样,就在很大程度上影响了《大纲》对命题和教材编写的规范效用,可能导致非常用义、次要词性先于常用义和主要词性出现的情况。例如,在某种初级教材中,“偷”、“就”二词首次出现的语境是: