有人存在的地方就有竞争,有竞争就需要有评价。然而,对人进行评价并不是一件容易的事,在高等教育领域中也不例外。教师评职称、评头衔要数论文,引人才又要看头衔……论文不够怎么办?学术“造假注水”便滋生出来。 这样的恶性循环,引起了党中央的注意,在2018年的两院院士大会上,习近平总书记就指出,“人才评价制度不合理,唯论文、唯职称、唯学历的现象仍然严重”。近年来,为解决这一问题,中共中央、国务院和教育部等部门发布的系列重大政策将“四唯”“五唯”清理作为突破口,推动着我国高校和科研院所科研评价制度由一元走向多元的重大转型与改革。 下面,笔者就将通过中美比较的视角,在对中美高等教育科研评价相关问题的优劣特征进行分析比较的基础上,探寻各自特点,力求促进和实现中美高等教育相互取长补短。 理解评价的本质 要对中美高等教育科研评价相关问题的优劣特征进行分析比较,明确评价概念在中美语境下的差异是前提。 教育评价在西方主要对应三个英文概念:Testing、Assessment和Evaluation。Testing,即考核、考试。Assessment,即各种能力测评。依据美国三大权威教育组织(美国教育研究会、美国心理学会、美国教育测量全国理事会)联合编制的《教育与心理测试标准》,Testing即通过一种系统的方法,获取有关人或项目的样本信息,从而推断出学生的知识、特征或倾向。Evaluation则侧重对教育干预效果的测定,包括微观层面教学策略效果的测定,以及宏观层面国家教育政策效果的测定。 这三者间,考试为评价提供收集证据的工具,测评是各项考试的综合,而考试和测评等多方面形成的证据可以支持有效的评价,三个概念间相互联系,环环相扣。因此,一个完整的教育评价过程包括了考试、测评和评价三个阶段。 那么,被人们广泛讨论、纠结的评价究竟是什么?该如何理解、剖析? 事实上,评价的本质是基于材料和证据的搜集与分析,对教育各个环节及其特征和结果进行判断的过程。比如,一所企业要想招聘一个人才,它需要该应聘者的简历,此外还要进行笔试、面试等,这都是根据材料和证据进行判断的环节。 评价有三个基本要素,分别是判断、标准、利益相关者。其中,作出判断是评价过程的终端环节;评价标准则是进行判断的根本依据。而评价标准的制定往往很难统一,它取决于价值观。因此,价值观的不同是导致评价标准产生争议的根源所在。 另外,任何评价过程都关涉多元的具有相互利益关系的主体。由于利益相关群体的多样化和差异化、资源及时间的有限性,教育评价往往很难同时满足各方利益诉求。但教育评价必须明确主要利益相关者,才能确定评价的价值导向、制定出符合利益相关主体需求的评价标准,继而作出合理的服务利益相关主体的价值判断。 评价工具——考试的诞生 在2300多年前的中国,科举考试制度诞生了。没有人能够预想到,由此诞生的考试制度竟一直延续至今。而西方在教育测评领域的历史则要比中国晚得多,以桑代克在1904年出版的教材《教育测量》和1923年出版的第一个斯坦福成就测验(SATest)为其教育测评领域最早的里程碑式的标志。 除了考试产生先后的差异外,美国考试发展的历程也与中国很不相同。 美国自20世纪30年代开始实施SAT考试,20世纪50年代开始实施区一级的标准化考试,20世纪70年代开始实施州一级的标准化考试,20世纪80年代扩大到全国考试,20世纪90年代后开始尝试国际考核。SAT在发展至今的八十余年里,其形式和内容基本上没有改变,仅在写作题目方面有所增添。考试发展的总体趋势是实施的范围和规模越来越大。可见,美国考试发展呈现自下而上的特征。 与之相反,中国考试的发展路径则呈现自上而下的特征,往往始于国家统一考试,继而逐渐放权到省和市。 虽然,中美教育和历史文化背景不同,但是不同的考试发展路径没有优劣之分,它们均服务于学生的发展和考试制度的不断完善,也是完成评价的工具之一。 面向问责的教育评价 教育评价的主要功能之一是问责。以美国为例,其最重要的教育法案——《不让一个孩子落后法案(NCLB)》即规定以考试结果作为问责的依据。根据NCLB法律要求,各州开发了州级统一考试,要求所有学生参加,并以测评结果为依据对教育管理者进行问责。以麻州为例,这一考试即马萨储塞州(以下简称麻州)综合评估系统。依据这一系统的测评结果,麻州学校被评定为五个等级:1级代表优异;2级代表合格;3级和4级代表较差(排名后20%的学校);5级代表“长期表现不佳”。其中,3~4等级的学校会获得额外支持与援助,5级学校将由麻州基础教育部接管。同时,各个学校的管理者会接受相应的问责。 事实上,基于评价的问责制度对于教育质量的提高有较为显著的效果。通过波士顿公立学校NCLB问责结果统计(2013-2016),我们或许可以有更加直观的感受。根据该统计,2013年,波士顿地区被统计的公立学校中1级21所、2级12所、3级59所、4级7所、5级2所;2014年,被统计的公立学校中,1级14所、2级22所、3级54所、4级7所、5级2所;2015年,被统计的公立学校中,1级14所、2级23所、3级53所、4级8所、5级2所;2016年,被统计的公立学校中,1级21所、2级24所、3级46所、4级9所、5级2所。从统计数据中可见,实行问责制度后,波士顿地区1级和2级的合格与优质公立学校总数基本呈现逐年增加的趋势,3级和4级需要改进的学校总数逐渐减少,可见,以测评驱动问责可在一定程度上提高教育质量。同时,测评也是实现教育公平的重要手段。考核不合格的学校多是弱势群体学生集中的学校,通过考核问责,这些学校被动提高了学生的学业成绩和教育质量。