正如阿斯汀指出的:“美国高等学校一个显著特征就是对评估的重视。”[1]自20世纪末以来,美国高等教育评估工作越来越受到高度重视,以回应日益强烈的社会问责要求,并为高等教育管理和改革提供决策依据。其中,本科教育是高等教育的基础,涉及广泛的利益相关者,因而成为众多评估项目中的焦点。 但是,本科教育的评估具有很大的难度。第一,本科教育效果的显现具有明显的滞后性;第二,本科教育效果的成因是多变量的,且变量之间的关系十分复杂;第三,本科教育培养目标具有多元化特征,很难形成普遍适用的统一的评估标准。因此,较之于高校的其他项目评估,本科教育评估可谓“难中之难”。其难点可概括为三个问题:第一,评什么(评估的内容,也就是一流的本科教育所包含的内容是什么);第二,评估的内容是不是可测量的;第三,如何建构测评的工具。 长期以来,美国社会盛行的“最佳大学排行榜”一直主导着本科教育的评估。 “排行榜”以学校所拥有的资源和声誉为依据。这种方法受到高等教育专家阿斯汀、帕斯卡雷拉、乔治·库等人的严厉批评。26世纪90年代开始,以长达80年之久的有关“大学如何影响本科生”研究的成果为基础,在相关基金会和高等教育专家的努力下,美国本科教育评估的路径,由传统的以资源和声誉为主导(即大学“排行榜”)转向了以学生为主体的教育实践(学生的学习行为和校园经验)为主导。本文将对这一路径转向及其理论基础、实际操作方式作简要评述。在此基础上,对改进我国本科教育及其评估工作作进一步的深入思考。 一、评估路径转向的内在逻辑 所谓的评估路径,其核心是指评估的内容,也就是“评什么”。评估路径的转变始于对传统评估路径的批评。传统评估路径以高校所拥有的资源和声誉为评估的主要内容。所谓的“一流”(excellence)的本科教育,主要包括:①资源。主要涉及一些易于测量的指标,如经费收入——用于购买图书、添置设备、支付教师酬金和学生奖学金等项目;高水平的教师——获得名牌大学学位、其研究成果和著作享有很高声誉的教师;高质量的学生——高中成绩优秀、入学考试获得高分、经过严格选拔而获得入学资格的学生。②声誉。主要是指社会上流传的大学学术知名度。 资源和声誉这一路径最终将导致“最佳大学排名榜”的产生。其具体排名的方法是,采用各种类型的主观判断(subjectively-judged)测量法用于对声誉的测量,以及高校公布的本校有关教育资源和人力资源数据用于测量学校所拥有的资源。然后,再将这两组数据分别加权,最终形成高校的综合得分。综合得分最高的学校排名最高,所有其他学校依据其综合得分的依次排名。“总而言之,学校拥有资源的份额,再加上入学的选拔度,等于‘一流’的本科教育。”[2] 阿斯汀、帕斯卡雷拉对基于资源和声誉评估的“大学排行榜”,提出了严厉的批评。在阿斯汀看来,这两个概念“没有直接突出高等学校的基本目标:培养学生和传授知识。”[3]他们进一步指出:首先,“排名”是否能够真正说明高校本科教育质量之间的差别,值得怀疑。因为在这些量化的指标中,那些排名比较接近的学校,相互之间的分差很小,很难说明这些学校之间在本科教育质量方面存在质的差别。更为重要的是,帕斯卡雷和特伦兹尼通过对数以千种有关“大学对本科生的影响”的研究文献进行了综述,结果表明,资源和声誉对学生的影响微乎其微,至多也只是有些间接的影响。 为此,阿斯汀提出了一种新的评估路径:“才能发展观”(Talent development)。根据这种“一流”观,“‘一流’的大学是指那些能够在学生知识和人格发展上产生最大影响的大学。用经济学家的话来说,就是‘最大化的增值’。”阿斯汀提出的这一路径,其基础在于他经过多年研究而形成的“学生参与”(student involvement)理论。这一理论的核心是“输入—环境—输出”模型(Input-Environment-output model,简称“IEO”模式)。“输入”是指学生进入太学时的基本特征;“环境”是指大学期间的学习和生活经验;“输出”是大学学习和生活经验所产生的结果(outcome)。1993年,阿斯汀出版了《大学关键的四年》[4]一书。在本书中,阿斯汀进一步系统介绍了他对美国大学新生进行的追踪研究,从中发现了大学环境影响学生的关键性因素。这些因素不仅涉及了学生的认知方面的发展,同时也涉及学生情感心理方面的发展。因此,所谓“才能发展观”,也就是要重点评估学生智力发展和人格发展的成效。这就将本科教育质量的评估从外在的特征——资源和声誉,转向了对学生学习效果的评估。这一转向可以称之为“学生/毕业生学习效果”(student/alumni outcome)的评估。显然,将评估的对象从资源和声誉等外部要素转向以学生学习为中心,更为接近本科教育的核心目标,因而具有标志性的重大意义。 然而,阿斯汀的IEO评估方法在理论上虽然具有合理性,但在实践上却很难具有操作性,因为阿斯汀所建立的是研究性的变量和数据,而不是评估所需要的具有操作性的指标。在《大学关键的四年》一书中,阿斯汀考查的输入特征有131项、环境变量192项、输出变量82项。可见其操作难度之大、之复杂。同时,“如果一所学校能够提供真正的‘一流’的本科教育,那么,其教育结果则在其毕业生身上有所表现,如他们的认知能力、活力与成就。”[5]但是,正如帕斯卡雷拉所指出的:这一推论“最大的问题在于其有一个前提假设,即认定所有的学校接受的都是同一种类的学生。”[6]显然,这不符合高等教育的现实。也就是说,这一评估方法有可能导致另一种误解。事实上,在进入大学之前,学生之间就存在着差异。在经过四年本科教育之后,毫无疑问,大学生在学识、智力、人格心理等方面发生了显著的变化。但造成这一变化的原因是多方面的:有的属于学生在入学前的个体差异;有的属于人的自然成熟带来的变化;有的属于社会变化带来的结果,当然,学校的影响也是最为重要的原因之一。而学校的影响才是评价本科教育质量的关键要素。