一 研究背景 语言测试目前是应用语言学领域的一个热点,近几年来,与语言测试相关的理论与实践更是取得了长足的进步和发展。各种语言测试(包括母语水平测试、外语水平测试、语言教学的评估与测试等)不断涌现,常模参照测试与标准参照测试、客观性测试与主观性测试、经典测试理论(CTT)与项目反应理论(IRT)此消彼长,互相促进。从与语言教学的关系看,语言测试一般可分为两大类:一类是针对具体的教学大纲、教学目标、教学内容以至某种教材的测试;另一类是不专门针对任何具体教学,而是着眼于人掌握语言、运用语言的能力和水平的测试。前一类大致属于标准参照测试;后一类大致属于常模参照测试。 目前在我国内地围绕新的课程标准而开展的各种课程评估就是针对具体教学目标的评价,测试手段是其中一个重要的组成部分,另外还包括观察、记录、问卷调查等,评价内容涉及“知识与技能”“过程与方法”“情感与态度”等方面。类似的评价在我国台、港、澳以及其他国家和地区都在开展,而对中国语文科的评价则是我国特有的领域。课程评价最显著的特点是针对明确的课程标准和教学目标,针对具体的教学内容和教学过程。这类评估基本上属于标准参照的范畴,当然,教学评估有时也采用百分等级或年级当量等方法,这就属于常模参照的范畴了。测验方法一般分为两种:一种是以判断、填空、选择和简答等题型为主的客观性测验;另一种是以整合信息资源、完成实验任务、书面习作等形式为主的表现性评价,也就是主观性测验。课程评价最重要的作用是对教学的反馈,一方面对教师的教学活动提供参考;另一方面对学生的学习活动提供参考,具有衡量教学效果和学习效果、并间接表明教学和学习的得与失等作用。可以说,课程评价越来越成为一切有计划、有目的的各科教学的一个不可或缺的重要组成部分。 另一方面,针对不同人群的各种语言水平测试近年来也方兴未艾,比如我国的“汉语水平考试(HSK)”“普通话水平测试(PSC)”,美国的TOFEL等。这些语言测试都是独立于任何具体教学的水平测试,其着眼点是人的语言能力以及所掌握的语言知识及掌握的程度等。在绝大多数较大规模的语言测试中,出于对测试条件、测试效率、测试成本等因素的考虑,一般都以客观性试题为主,选择题、判断题、填空题等占了相当大的比重。当然,对于这种状况,一直都存在着两种截然不同的意见:赞成的一方强调客观性测试的信度,强调测试内容的典型、广泛和平衡;不赞成的一方指出客观性测试的效度不够理想,不能真实反映应试人的水平和能力。这些争论虽然各执一端,都不尽全面和合理,但是客观上却推动了语言测试向更深的方向发展。目前已经出现了书面作文的计算机评分系统,诚然这样的系统还有待实践的检验和进一步完善。 当然,任何一种测试都是为特定目的服务的,比如针对语文课程标准的评价,其中的“知识与技能”范畴主要是评价教学活动是否实现了预期的教学目标,学生是否掌握了课程内容、是否达到了某种教学要求等。而从语言文字应用能力着眼,全面描述学习者在不同学习阶段的行为表现,以及这种行为表现在层次和程度上显现出的差异等,则并不完全属于课程评价的范畴。HSK是一种标准化的语言水平考试,评价对象是母语非汉语的学习者,对象明确,用途明确,评价范围和评价指标主要是听力理解、阅读理解、语法结构和词语用法等,而识字写字、口语表达和书面表达等内容则没有列入初等、中等的考试范围,只有高等汉语水平考试中有作文和口语。 在我国,针对国家通用语言文字的国家级测试目前只有“普通话水平测试(PSC)”和“汉字应用水平测试(HZC)”。“普通话水平测试”根据自身的测试目的,其测试内容绝大多数针对普通话语音、词汇、语法等所占的比例并不大。“汉字应用水平测试”则主要针对应试人在阅读、书面表达等活动中能够掌握和运用规范汉字的数量,以及运用的正确程度和准确程度,词语、句子等较大语言单位只是作为汉字出现的语言环境,服务于衡量汉字应用水平的需要。这两种测试都属于中文应用能力测评的范畴,但还不是全面的中文应用能力测评。与此同时,各种外语测试在我国却开展得如火如荼,特别是一些部门和单位已经把某些外语测试定为资格认证和考核的依据或指标,例如大学英语的四六级考试等。反观国外,许多国家和地区针对本国人、本民族语言的测试和认证开展得十分普遍和广泛,例如在美国,有许多机构提供衡量学习者英语能力的测评服务,而且这些测评已经成为他们国民教育的重要组成部分。这种现象给我们提出了许多值得思考的东西,也提供了许多值得借鉴的宝贵经验。因此,根据汉语汉字的规律和特点,以及学习者、使用者学习和使用汉语汉字的规律和特点,研制全面衡量学习者、使用者使用中文水平的测评系统,已经到了必须起步的时候了。 二 研究的目的、意义和作用 “中文应用能力测评”的最终目的是建立一整套科学的、标准化的中文应用能力测评体系,这个系统应当包括中文应用能力等级标准和测试大纲,包括试题、试卷、题库和评分标准等。整个系统应当具有标准明确、操作性强等特征,能够通过测试的方式对中文学习者和中文使用者的中文应用水平提供客观的描述和评价。 “中文应用能力测评”的对象理论上涵盖所有中文学习者和中文使用者,其中既包括母语为汉语的人,也包括母语非汉语的人。测评对象的中文程度从零起点一直到熟练准确使用。其中零起点有两层含义:一层是语言零起点,指的是母语非汉语的人在学习中文之前的状态;另一层是文字零起点,指的是以汉语为母语的人在学习汉字之前的状态。前一种是真正意义上的零起点;而后一种是特定含义上的零起点,姑且称之为准零起点。因此,测评标准和测评方法应当充分考虑这两种不同情况,明确对象,明确任务,加强针对性。