关于修订《(汉语水平)词汇等级大纲》的若干意见

作者简介:
赵金铭,男,教授,博士生导师。现任北京语言大学对外汉语研究中心主任。出版专著《汉语研究与对外汉语教学》,发表有关近现代汉语语法和对外汉语教学论文数十篇。 张博,女,文学博士,教授。现为北京语言大学对外汉语研究中心驻所研究人员。出版专著《汉语同族词的系统性与验证方法》、论文集《古代汉语词汇研究》等。 程娟,女,文学硕士,副教授。现任北京语言大学人文学院中文系系主任。发表《〈金瓶梅〉复音形容词结构特征初探》、《新词新义对比研究》等论文约20篇。

原文出处:
世界汉语教学

内容提要:

本文首先讨论了修订《(汉语水平)词汇等级大纲》应确立的两个主要目标:1)重新进行词语筛选和分级;2)附注多义词的主要义项和兼类词的不同词性的等级;认为实现这两个目标的先决条件是利用大型语料库进行精细的词频和义频统计;然后分析了由于缺乏义频分析而使《大纲》编制难以避免的多义词义项筛选及等级不明、兼类词的某一词性失注或多注、兼类词的词性排序失当、同形词误合为一以及同形词失收等问题;最后指出《大纲》还应在兼类词与同形同音词的划界、轻声词与儿化词的注音、等义词的括注、词缀的名称及处理、非词成分的处理等方面有所改进。


期刊代号:H1
分类名称:语言文字学
复印期号:2003 年 12 期

关 键 词:

字号:

      1992年6月,国家汉浯水平考试委员会办公室考试中心制定的《汉浯水平词汇与汉字等级大纲》正式颁布。10年来,它为我国汉语水平考试的开发和教材编写提供了明确的依据和规范,在对外汉语教学领域发挥了巨大的作用。为使之更臻完善,最近有关部门正组织力量对其进行补充修订。我们认为,这是一项意义十分重大的工程,同时也是一件非常艰苦复杂的工作,应当得到对外汉浯教学界的广泛关注与支持。为此,我们谨就《(汉语水平)词汇等级大纲》(以下简称《大纲》的修订谈一些不成熟的思考,希望能对这项工作有点滴帮助。

      一 《大纲》的修订目标与先决条件

      要在哪些方面对现行《大纲》加以改进?修订《大纲》的预期目标是什么?我们应当从《大纲》的性质、编制依据和用途出发来考虑这些问题。

      《(汉语水平)词汇等级大纲》“不同于一般的教学大纲.而是一种规范性的水平大纲。”(刘英林、宋绍周,1992)其性质决定了《大纲》的编制必须以词语的使用频度为原则,用使用频度来衡量词语的常用程度,以进行词语筛选和确定词语的等级。因此,《大纲》编制者主要选取北京语言学院的《现代汉语频率词典》(以下简称《频率词典》)和刘源等编《现代汉语常用词词频词典》(以下简称《词频词典》等7种词(字)频统计成果作为定量分析的依据,获取词语频度的基本数据。这些词频统计在当时水平较高、影响较大,可是作为编制《大纲》的依据,却远不够理想,主要有以下几点缺欠:

      第一,用于词频统计的语料在数量、范围和语体等方面都多有局限,这影响了一些词语频率指数的可靠性。比如,《词频词典》选用语料2500万字,其中“米饭”和“主义”的词次之比是25∶4161;《频率词典》选用语料180万字,其中“米饭”一词未出现,而“主义”的词次高达3782次,在使用度最高的词中排在第54位。这些数据显然与两词在汉语社团现实生活中真实的使用频率相去甚远。

      第二,未能划清字词界限,多把同形词作为一个单位进行词频统计。《词频词典》这方面的问题最为严重,不仅未能区分同音同形词,还把读音不同的同形词合在一起进行统计,例如:

      背(bēi,bèi) 笼(lóng,lǒng) 华(huá,huà)

      白干(báigàn,báigānr) 拆散(chāisǎn,chāisàn) 废物(fèiwù,fèiwu)

      结果(jēiguǒ,jiéguǒ) 门道(méndào,méndao) 下水(xiàshuǐ,xàishui)

      《频率词典》在这方面做得较好,将异音同形词全部分立,但仍未能完全区分同音同形词,例如:杜鹃(a.鸟名;b.植物名)、豁(a.~了一个口子;b.~出三天工夫)、搀(a.~着奶奶;b.~点水)等,都是把两个词合在一起统计。由于词频词典在一定程度上是以形为准进行统计,就使得用字相同的词的使用频率未能得到清晰的反映。

      第三,未能细致地统计多义词在不同义项、兼类词在不同词性上的使用频率。只有《频率词典》对部分兼类词是分词性统计词频的,但这一原则并未用于所有的词,例如“孤立”、“冷落”未区分形容词和动词词性,“组织”、“注释”未区分动词和名词词性,“还是”未区分副词词性和连词词性。

      现有词频统计的这些缺欠,都在不同程度上给《大纲》的编制和修订带来了困难。

      

      表中的A类词是政论性文体中的高频词,B类词是生活性语体中的高频词,如果真按它们的等级序列编写教材,势必会使学习者硬学一些用不着或极少用到的词,而交际需要的词又一时学不到,从而影响学习效率和积极性。

      第二点缺欠导致同形词各方的词频都没有确定的数据。比如《词频词典》“结果(jiēguǒ,jiéguǒ)”的频度(词次)为4635,然而这一种写法、两种读音实际上代表了4个词语(注:在《现代汉语词典》中,“【结果】1”和“【结果】2”属同一个词。此据《大纲》分立。):

      【结果】jiē∥guǒ:长出果实。

      【结果】1jiéguǒ:(名词)成就,成果。

      【结果】2jiéguǒ:(连词)用在表过程或原因的分句后,引出事物发展的最后状态。

      【结果】3jiéguǒ:将人杀死。

      把这4个词合在一起进行统汁所得出的数据,对于《大纲》编制来说毫无意义。因为无法从4个词的词频之和中获知每一个词的词频状况。

      相比较而言,第三点缺欠对《大纲》编制的不利影响更大、更深刻。《大纲》所列8000余词是汉浯常用词,其多义现象十分突出,因为词的常用性与多义性是成正比的;加之汉浯由于缺乏词形标记,词的兼类现象又很普遍,因此词的多个义项往往又与其不同的词性相关。对于多义词和兼类词来说,其在不同义项和不同词性上的使用频率(以下分别简称“义频”和“类频”)往往是有差异的。现有的词频统计都是以词为单位进行统计,对一个词在何种意义上使用不予考虑,只有个别词频统计有限地区分了兼类词在不同词性上的使用频率。依据这类粗疏的词频统计结果,《大纲》只能以词为单位进行等级排列,而不能细致地定出多义词不同义项的等级和兼类词不同词性的等级。这样,就在很大程度上影响了《大纲》对命题和教材编写的规范效用,可能导致非常用义、次要词性先于常用义和主要词性出现的情况。例如,在某种初级教材中,“偷”、“就”二词首次出现的语境是:

相关文章: