一、研制背景、过程及内容 (一)研制背景 《义务教育语文课程标准》(以下简称《语文课程标准》)对小学和初中的语文教学中词汇的学习和使用有明确要求。现行各种教材也设有名称不同而功能相同的“识字组词”“字词积累”“读一读,写一写”“词语比较”等词汇学习栏目,但对词汇学习的质和量却一直没有明确的要求与范围。不同教材之间的词汇面貌和词汇量差异非常大,在我们所统计的教材中共有词只有40%(苏新春,2008),生词的共用部分比例更低①。长期以来中小学语文教学界对学习性词有很高的期盼,从叶圣陶、吕叔湘、张志公等前辈学者到一线教师,都表达了对学习性词表研制的期待(赖华强,2006)。语文教学界也曾有过研制学习性词表的尝试,但因各种原因或是没有公布,或是没有进入中小学校的教学实际。前者如娄警予、马世一等用手工统计的《中学生常用词汇表》,后者如北京师范大学的《现代汉语词表》《三千常用词表》等(赖华强,2006)。从20世纪中期起,有关政府部门或相关单位陆续研制、公布的汉语词表有20多种(苏新春,2010)。主要分三类,一是对外汉语教学用词表,二是中文信息处理用词表,三是面向社会一般应用的通用词表。由于义务教育学习性词表的独特性质与功能,决定了它不可能照搬面向社会一般应用的通用性词表。 为了加强义务教育阶段语文教学的科学性与针对性,为提高中小学语文教学水平提供有用的学习资源,为我国语文应用及有关语文教育政策的制定提供科学依据,并有助于汉语规范化、推广普通话、推行汉语国际教育、中文信息处理及辞书编纂等工作,国家语委于2011年批准设立“基础教育学习性词表的研制”的课题,于2016年8月批准设立国家语委语言文字科研项目优秀成果后期资助“《基础教育学习性词表》的分级、验证及推广”课题,由厦门大学国家语言资源监测与研究教育教材中心承担。 (二)研制过程 词表研制工作经历了两个阶段。第一阶段始于2011年。课题组主要开展了四个方面的工作:一、确定中小学生学习性词表的性质与特点。二、探索基础教育语文与其他学科教材的语言状况、特点及规律,包括当前使用的新课标语文教材、历史地理与数学物理化学等学科教材,之前使用的义务教育语文教材及香港、台湾地区的语文教材。三、比较不同词表的研制方法,各研制方法的价值、作用、特点及对词表的影响。四、比较儿童阅读与词汇应用、中小学词汇教学与测试等。第二阶段始于2016年8月,主要是词语分级与义序表的编排。 (三)词表内容 《义务教育常用词表(草案)》(以下简称《词表(草案)》)共包括词14323条。共分四级,一级词1807条,二级词4997条,三级词4779条,四级词2740条。分别对应于第一学段(小学一、二年级),第二学段(小学三、四年级),第三学段(小学五、六年级),第四学段(初中一至三年级)。按词长统计有一字词1543条,二字词9863条,三字语374条,四字语2543条。 主表为《音序表》。所有词条按音序排列,词形相同者归为一个。每个词条后带有六个信息:(1)音序表序号,(2)词目,(3)词级,(4)拼音,(5)词性,(6)义类编号。“义类编号”显示了词义的语义分类,起到了将主表与附表关联的作用。拼音与词类根据词义而定。拼音依《汉语拼音正词法基本规则》②标示,参照《现代汉语词典》第7版。 附表为《义序表》。参照的义类系统为《现代汉语分类词典》(苏新春,2013;以下简称《分类词典》)。该义类系统收录现代汉语通用词目83000余条,按五级语义层划分。有一级类9类,二级类62类,三级类508类,四级类2057类,五级类12659类。《词表(草案)》14323个词条在其中能关联到的义项有18200多个,经人工干预甄别,排除了若干偏难偏僻的义项,其他的形成《义序表》。《义序表》按《分类词典》的分类系统顺序排列。词语后面括号中的数字表示词的等级。编制义序表的目的主要是为了让“音序表”中的词能按语义的相同、相近或相关排列,以方便学习与教学。 二、词表的性质与功能 (一)词表性质 词表性质是词表研制中最重要的影响因素。词表性质决定了词表的功能、规模、内容、词的来源及研制方法等一系列重要问题。《词表(草案)》具有以下几项属性: 1.是词表而非词集。词表的容量有限,对收入词表的词有仔细考量,有提取方法,有内在的序列结构,并根据不同的需要进行等级划分。而词集只是对调查语料内所有词的汇集,排列时往往是按无理据性的音序、笔画顺序,或是单一的频序来排列。词表对收词有很强的“选择性”。词表研制的难点不在收词的多与全,而在适量与恰当。 2.是学习性词表而非通用性词表。学习性词表反映了对学习内容与教学标准的要求,要在一定条件下通过一定教学手段以达到预定的教学目的。收词及内部的分级分等要符合词表使用者的认知需求和认知特点。根据学习等级的要求来划分词级是学习性词表最重要的内容之一。而通用性词表,反映的是社会普通成员在一般言语交际活动中使用的通用性词语。它一般是按使用状况来排列,如频率、分布率或综合二者而成的使用度。