中图分类号:G646文献标识码:A文章编号:1001-4519(2006)05-0001-10 一、大学排行榜及其运作 大学排名是用一套共同适用的指标体系将一定范围内的大学(通常是一个国家之内)按照分数高低的顺序进行排列。除了个别情况以外(如德国的CHE/DAAD排名,这个排名后面将会讨论到),大学排名都表现为“联赛榜”的形式,把各个“运动队”按照它们的分数高低排在一张表格里。 从性质上看,排行榜就是把大学的全部工作归结为单一的、可比的、数字化的指标体系。对很多人来说,这正是排行榜不合理的地方:把成百上千的人们在不同的学术领域内所作的工作转化为单一的分数。在大多数排名系统中,排名的工作分为三个阶段:第一阶段是根据指标收集数据;第二个阶段是把每个指标相关的数据转化为分数;第三个阶段是把不同指标的分数加权、总计得出排名。 排行榜前期工作的一个关键问题是收集数据的方法,大致有三种主要的数据来源。一是调查数据。不同的大学有关教育质量的比较数据可以通过对各种利益相关者的意见和感受的调查来获得。二是独立的第三方。政府部门经常在其权限范围内收集并公布大学的一些数据,这些数据可以用作对大学进行比较的客观标准。三是大学。最全面、最详细的数据来源当然是大学自身,因而他们是潜在的有着丰富数据的来源。 二、排行榜评估的内容:对指标的考察 为了便于对指标进行考察,我们试图以芬尼和厄舍在他们关于“中等后教育质量测评体系”提议中的一个大学质量模型为部分依据,将众多指标分成更大的类目,建立起一个质量测评的概念框架。 芬尼和厄舍的质量模型以下列四个要素为基础。(1)新生质量,该要素指新生刚开始学习时的特点、品质和能力。(2)教育投入,主要有两种类型:一是资源,学生和教师可以享受的、服务于教育目标的财政和物质资源;二是师资,不仅包括师资数量,而且包括教师教学方式以及学习氛围。这通过师生交往的时间、考试的类型等进行评估(有时也指教学)。(3)教育产出,指毕业生从其教育经历中获得的技能或其他品质,诸如批判性思维、分析推理、技能知识。(4)最终成果,是指教育体系可能贡献的终极结果,既包括那些传统的评价指标如就业率和收入,也包括其他对个人和社会有重要影响的结果,如工作满意度、欣赏生活中美好的东西以及做一个“好公民”。 我们要从两个方面对这个分类进行修正。首先,要清楚区分两种类型的投入,即“教育投入—资源”和“教育投入—师资”。其次,要把“科研”与“声誉”包括进来。因此,我们将质量指标分成七类: 1.新生质量指标 新生质量是指学生开始学习时的特点和能力。最常见的新生质量指标是全国标准化考试成绩。有9个排行榜采用了这一指标。香港专业教育网和《卫报》最重视这个评估指标(权重20%)、墨尔本研究所(11%)、《亚洲周刊》(8.33%)、《美国新闻与世界报道》(7.5%)、网大(5.95%)、《金融时报》(5%)、《泰晤士报》(3.3%)、武汉大学(0.33%)也都采用了这一评估指标。因为这些数据的收集和标准化是由全国性组织实施的,所以它有这样的好处,即它可以被视为决定每所大学入学新生的相对实力的一个相对公平的方法。在这个标准上,加拿大是一个例外,其主要的排名机构《麦克林杂志》采用中学的等级来评估学生实力。在加拿大没有全国性考试的情况下,这是退而求其次的解决方法。但在缺少全国标准化的情况下,这一标准无疑是一个稍差的指标,因为它无法确保在某一管辖范围内的“A”级水平真的与另一管辖范围内的“A”级水平相等。 另一个评估学生实力的方法是入学新生获得(第三方)奖励的比例,在武汉大学的调查中该指标权重达到11%。也可通过评估大学的选择性来分析这一问题。实际上,这种方法通过申请学生被拒的比例来推断学生的实力。 如果一所学校能够吸引大量的国际学生或学区外学生,或者拥有多样化种族背景的学生,那么通常会认为这所学校的学生具有较强实力。《华盛顿月刊》对此持不同的看法。为了采用大学对社会流动的贡献作为评估方法,它将来自下层收入背景的学生比例作为评估指标(用接受以经济需要为基础的联邦佩尔助学金的学生比例来代表)。 有些“新生质量”指标与学生的学习状态相联系。中国有两个排行榜(网大和武汉大学)采用了一个以研究生比例为依据的指标。在波兰《共和国报》排行榜中,采用旁听课程的研究生人数作为指标。意大利《共和报》根据学校的非全日制学生人数来对大学进行排名。与北美地区盛行的“非全日制学习不受欢迎”观点相反,意大利的排名积极地看待越来越多的非全日制学生人数。《华盛顿月刊》也有一个反映新生质量的最终指标分类,即学生从事社区服务的可能性,该指标用进入美国和平服务队(Peace Corps)、预备军官训练队(Reserve Officer Training Corps(ROTC))的学生比例以及在社区中半工半读的学生比例来评估。 2.教育投入指标——师资 通常,师资的数量和质量与大学的质量之间呈正相关关系。最简单的评估办法是评估教师的人数,这种方式没有考虑学生规模等因素。而大多数国家的排行榜更喜欢在师生比的概念上做文章。还有一些排行榜试图采用诸如教师授课门次或生均课时的办法来评估教学强度。