[中图分类号]G40-058.1 [文献标识码]A [文章编号]1006-7469(2022)02-0060-17 如何对学生学业表现作出合理的成绩评定,一直是学生学业评估关注的焦点之一。早期西方高校采取的是常模参照(norm-referencing)方式,通过学生在正态分布曲线上的排名给予相应的等级成绩。在之后的评估发展中,教育学者意识到这种评估方式过于强调学生之间的竞争,不利于合作学习的开展。此外,评估内容缺乏方向指引,容易造成评估内容与教学内容割裂,也不利于检视和监督评估成效与质量。在我国,大学生学业评估多关注学生的成就表现(student achievement),例如用增值评估(value-added assessment)的方法分析学生在学习生涯中的发展变化。[1]我国学者李湘琴等指出,常见的学习成就评估途径有两种:一是标准化测验,例如由美国教育考试服务中心开发的“ETS学术熟练程度测试”(ETS Proficiency Profile,简称EPP)、“大学学习评估”(The Collegiate Learning Assessment,简称CLA)等;二是学生自我评价,即通过学生自己陈述在课内外学习活动中的收获、体验,从而实现对学习成就的增值评估。[2]需要指出的是,以上两种评估方式均非直接针对学生在每门课程中的学习经验。要深入了解学生获得了哪些智性能力和价值观的成长,一个不可缺少的路径是从学生亲身经历的每门课程入手,这意味着对学生的学习成就评估除了要关注一般性的思维与认知以及学生的自我评价,更要关注学生在具体一门课程中获得了哪些知识、能力、价值观上的发展。 从国内外实施学生学业评估的实践来看,确保课程、教学与评估的一致性、有效对学业评估成效进行质量监督(quality assurance)、具体了解学生在每门课程中所取得的发展、给予学生一个公平合理的成绩评定,这一系列议题是高等教育学生学业评估的重心所在。近年来,西方高校逐步实施了标准参照评估(criterion-referenced assessment),其目的正是致力于解决以上问题。通过对每门课程考核设置评估标准(assessment criteria),成绩评定以及对评估结果的问责和检视则依据评估标准的设定,以实现教评整合、评分透明以及有效监督。然而在标准参照评估的实际应用中,完全依照评估标准进行评估并非易事。一方面,成绩评定容易受到常模参照评分的影响;另一方面,如何设置评估标准、教师如何使用评估标准评分等问题无论在理论还是实践中都遇到不少难题。要回应和解决这些难题,需要对评估理论本身所体现的教育价值理念有清晰的把握,只有将评估所期望实现的教育目的内化,评估实践者在设计、实施和监督评估结果的过程中,才能避免其他因素干扰,充分发挥标准参照的精粹。 本文目的在于厘清不同时期有哪些教育理念对标准参照评估产生了影响,这些影响又构成了怎样的评估特点和生态。通过标准参照评估背后的价值理念所体现的教育目的与追求的剖析,来梳理标准参照评估的特征,以及反思如何在实践中对其进行正确的运用。需指出的是,此前关于标准参照评估的研究,多采用实证研究方式,指出其在实践中所遇到的具体问题,或者是描述标准参照评估下的评分特征,很少从历史溯源的角度回顾标准参照评估的发展,以及整体和系统性地指出其在实践中面临的主要问题。本文以标准参照评估的发展历程为时间轴,将其背后的教育价值理念及其演变进行整理,指出标准参照评估理论和实践层面所面临的困境和可能的解决途径。文章也对标准参照评估在我国高校的开展进行了探索和反思,以期为有需要实施这种评估的同行提供有价值的参考。 一、概念辨析 标准参照评估是指以一套预先确定的评估标准作为学业评判的依据,学生所获得的成绩体现了对标准的完成度。评估标准的选择和确立基于学习成果,通过这些明晰的评估指标和标准描述,教师和学生对于要达至的考核目标、考评任务和学习要求便有了总体的把握和清晰的认识。[3-4]另外一种常见的学业评估方式为常模参照评估(norm-referenced assessment)。它是指在某个固定的群体中,根据群体内成员表现的优异程度进行排名,学生学业成绩的高低仅仅反映他在整个学习群体中的表现,并不反映实现预设评估指标的情况。常模参照评估主要用于鉴别和区分,以录取合适的人才、分配相应资源。[5-6] 在学业评估实践中,可以说两种方式各有优势和不足。采取常模参照对学业整体表现优良的群体常常产生诸多限制。例如香港中文大学2018年之前采取常模参照评估,对各成绩等级的学生人数作出了一定的规定①,这样做的结果很可能导致当一个班所有学生表现均能达到B+甚至A-②,但因为人数的限制,使得一部分学生得到比实际表现低的成绩。标准参照评估则完全可以避免这一限制,但与此同时却容易带来另一个问题——高分泛滥(grade inflation)以及较低标准便能合格,这些问题在常模参照中则可以轻松化解。事实上,标准参照和常模参照完全可以是两种互补的评估方式。[7-8]标准参照能直观反映学习目标的实现程度,常模参照则可以约束教师打高分的情况。但笔者通过文献梳理和实践观察发现,标准参照评估已经取代常模参照评估,成为西方高等教育学生学业评估中最主要的一种评估方式。