近年来,国家愈发关注评价在教育改革中的支点作用。2020年,中共中央、国务院印发的《深化新时代教育评价改革总体方案》指出,要“扭转不科学的教育评价导向……提高教育治理能力和水平,加快推进教育现代化、建设教育强国、办好人民满意的教育”[1]。2023年5月,教育部办公厅印发的《基础教育课程教学改革深化行动方案》进一步提出,要开展“教学评价牵引行动”“注重过程性评价,实现以评促教、以评促学,促进学生全面发展”[2]。 测量科学学家米斯里维(Mislevy)提出教育评价应当符合的四大隐喻,即“评价即测量”“评价即证据论证”“评价即实践”和“评价即反馈回路”[3]。长久以来我国的教育评价高度偏向“评价即测量”的隐喻,使评价不能有效转化为对促进学生学习和教师教学的具体指导,也难以为学生核心素养发展提供有效助力。而基于核心素养的评价连续体设计强调实现多类型、多方法的评价,旨在构建一个从输入(课程设计)、过程(教学实施)到输出(学习成果评价)全链条的评价体系,不仅关注最终结果,也重视学习过程,且紧密围绕核心素养的培养实现以评促教、以评促学,真正促进学生全面发展。 一、基于核心素养的评价连续体的内涵及特征 (一)评价连续体的内涵 连续体(Continuum)指事物在时间上连续不断、空间上紧密关联、性质上相互交融的统一整体[4]。连续体摒弃二元对立和非此即彼的思维,认为两种看似极端的状态间存在过渡性的、不断演变的连续地带。连续体也是一种观察问题的方式,澳大利亚管理学家厄普沃德(Upward)指出:“连续体提供了一种方法用以解释过去被视为空间和时间上独立维度的复杂现实。”[5]根据上述定义,本研究认为,评价连续体指从多个来源获取信息,混合使用多种评价类型和方式以衡量对于不同目标的实现程度,最终形成整体而联动的评价系统。 在美国颁布《共同核心州立标准》(Common Core State Standards)后,达令-哈蒙德(Darling-Hammond)团队意识到人们需要更多的评估手段来衡量综合教育目标的达成情况,指出对学生的评估应形成协调的评价连续体(见图1)以捕捉学生必备的广泛技能。该评价连续体的最左端是如今被采用最多甚至被许多教育者唯一采用的评价模式,其评价任务通常是基于大量封闭式问题的传统标准化测验以考查学生的低阶思维技能,虽然具有效率高、成本低、技术成熟的特征,但却只能勾勒出学生学习效果的整体“轮廓”,进而呈现出狭窄化、扁平化和表面化的特征,忽视了更深层次学习的效果,构不成学习样态的立体“全貌”。更高阶的评价则须走向右端,追求对深度学习的整体性评价,并从封闭式的标准化测验逐步发展为表现性的评价任务,以满足不断增长的教育需求。越靠近连续体右端,就越从一般表现性评价任务转向以项目为中心的评价。项目式评价的实质也是表现性评价,但是项目式评价任务所需的时间更长、步骤更多。在评价连续体的右端,评价的目标不再聚焦学生“知道”和“如何知道”零星客观知识的能力,而是聚焦学生把握和运用知识的综合水平。更进一步,表现性任务不再只狭隘地评价学生的认知功能,还关注学生展示学习成果的文化、情感和情境元素。同样备受关注的还有威金斯(Wiggins)构建的评价连续体,该连续体明确指出了教育目标的优先级与对应评价方式间的关系[6](见图2)。最边缘的目标希望学生熟悉零散的知识内容,主要采用传统测验(quiz)和测试(test)加以评价。位于最中心的目标指向学科的核心,希望学生在遗忘诸多细节知识后,依然能对学科的“大思想”或“大概念”深入理解,强调相比零散知识的记忆,更为重要的是让学生了解学科知识是如何产生、检验和使用的,这一圈层所对应评价类型更偏向表现性评价任务和项目,以捕捉学生获得持久性理解并能在情境中运用所学知识的证据。

图1 达令·哈蒙德的评价连续体框架图[7][8]

图2 威金斯的评价连续体框架图 从达令·哈蒙德和威金斯构建的评价连续体来看,传统测验和表现性评价这两种评价模式都沿着一条完整的连续体而存在,二者是相互补充的关系并且中间具有一定的过渡区间。虽然时兴的教育追求是“教育即点燃”而非“填满”,但“点燃火焰”依然需要以“添柴加木”为基础。因此,高阶的、整体的、指向深度学习的评价虽然值得鼓励,但连续体另一端的评价方式依然有其价值。评价连续体能避免评价的片面性和割裂性,教师须把握对立统一之精髓,根据不同的教育目标选择连续体上不同的评价方式。 (二)基于核心素养的评价连续体的特征 评价连续体近年来逐渐被我国教育界所关注,但系统性的研究还相对较少,因此有必要结合我国教育实践对其进一步阐释,特别是中国基础教育评价连续体的建构与发展应当对培养核心素养的时代诉求加以回应,并在中国特色的话语下加以表达。改革开放40余年,我国基础教育课程改革目标从“双基”“三维”发展到“核心素养”。具体来讲,“双基”时代强调学生对基础知识和基础技能的学习,注重记忆和理解。“三维目标”在“双基”的基础之上希望学生通过掌握学习的过程与方法表示“会学”,在学习情意方面体现“乐学”。进入“核心素养”时代则强调知识、技能、过程、方法、情感、态度、价值观的内在统一性和综合整体性,以培养能适应真实世界的“全面发展的人”。在基于“双基”的单一目标的指引下,标准封闭式测验是绝对主导的评价方式,无法形成评价连续体。而在“核心素养”的目标下,学生形象更加多维立体,评价目标足以构成从“双基”到“核心素养”的连续体,并且有大量可供选择的评价方式服务于不同的目标,为建立指向核心素养的评价连续体打下基础。以语文学科为例,基于语文学科核心素养的评价连续体(见图3)一端以培养语文学科基础知识和基础技能为目标,学生学习的过程与方法和学习情意则处于向另一端发展的过渡阶段,最终端指向由文化自信、语言运用、思维能力和审美创造构成的语文学科核心素养。在评价连续体下,一端是确保记忆理解准确性的传统题目测验,另一端是体现综合素养水平的表现性任务,教师则根据不同的目标在评价任务连续体中进行选择。