中图分类号:G642 文献标识码:A 文章编号:1673-7164(2008)10-0077-08 一、引言 随着大学招生人数增加,上大学相对更加容易了。但是大部分家庭在第一个孩子进入大学学习时,面临如何在众多的招生学校中选择自己喜欢的大学的问题。大学排名对于学生和家长了解大学的声誉、特征都有巨大的帮助。目前影响较大的排名机构有三家,分别是网大有限公司、中国管理科学研究院和中国校友会网,但这些排名还没有得到广泛的认可,指标计算的数据也没有公开。① 虽然每个排名有不同的指标体系和权重,有些排名也涉及到学校的声誉,但都没有学生和家长最关心的关于学校吸引力大小的指标。 我们根据中国高考录取机制的性质,提出了一个估计中国大学吸引力的显示偏好排名模型。基于显示偏好的大学排名度量的是学生或者家长眼里的学校吸引力,这个吸引力可能反映了学校的质量,但也不完全是学校的质量。对于什么是大学的质量,不同的人会有不同的看法。对于相同的大学特征,如声誉、师生比例、科研经费、地理位置、校园环境等,学生和家长、教育管理机构甚至普通的大众,对这些因素的权重可能都有自己的看法。我们构建的显示偏好的排名,就是这些意见的综合,反映了人们看法中的一致性因素。 基于显示偏好的学校吸引力排名综合了所有考生的选择中所包含的信息,对考生和家长了解其他人的看法具有实用价值。考生和家长们为什么要了解其他人的看法,Avery Christopher等人提供了三种解释:第一,在大学教育中,和什么人在一起学习是很重要的。见贤思齐,学生不但关心学校的质量,也关心和自己在一起的学生的情况。第二,每个考生对于学校也有各种各样的信息,但是考生明白自己的信息可能是不完全的,通过了解其他人的看法和行动,可以弥补自己信息的偏差。第三,考生可能通过选择不同的学校来显示自己的能力,这就是教育的信号甄别功能。②③考生通过学校的选择来显示自己不同凡响的能力,在均衡状态时,清华大学录取的考生和江南大学录取的考生有着不同的能力。在中国的招生制度下,家长关心其他人的选择和偏好还有第四个原因:了解其他人的偏好便于考生填报志愿,协调到均衡结果。 在中国,考生是按照分数和对学校的偏好(志愿)根据高考录取制度统一录取的。在出分填报志愿时,高考录取的结果等价于把所有考生按分数从高到低排序,每个考生依次从可选择的学校中选择他最偏好的学校录取。不同分数的考生有不同的可选择范围,分数最高的学生可以选择所有的招生学校,而分数低的考生选择范围小。通过考生的选择和录取的格局,可以推断学校吸引力的分布情况。 二、概率模型 (一)大学的吸引力 为了进行大学排名,我们必然假设每个大学有一个隐含的表示大学吸引力的变量,我们可以根据吸引力的大小来给大学排名。虽然不能观测到这个吸引力,但是可以估计出它的数值。大学的吸引力由多方面因素构成,如大学的声誉、教育质量、专业、学校位置、学费、学术资源等。我们不需要知道这些特征如何构建出大学的吸引力,仅仅假设学生是根据学校吸引力的大小一致地行事。 构建这个显示偏好吸引力排名,也不需要假设所有学生对学校的吸引力有相同的看法。每个考生对于学校吸引力的看法可以在一个均值周围分布。如果所有的考生对学校吸引力的看法一样,考生的表现就会完全相同,但这并不存在。我们假设每个考生对学校吸引力的看法都有自己特异的因素,正是考生不同的看法造成了学校在争夺学生时互有胜负的模式。显示偏好排名还有另外一个好处,就是并不需要真实存在一个潜在的吸引力排名,如果在考生和家长心目中不存在普遍一致的对学校吸引力的看法,这种方法估计出来的排名就没有一致性。可以设想,如果每个考生对于大学的偏好都是随机的,最后得到的录取结果就没有任何模式,各个学校的输赢也是随机决定的,不存在一个显然的模式。但是,不管学生如何形成自己的偏好,只要在他们之间存在共同的模式,那么显示偏好排名就可以把这些系统性的因素显示出来。 (二)考生录取的多元比较问题 大学排名问题可以从多元比较的框架来看。当考生选择学校填报时,根据他的分数,他在当时仍然招生的学校进行选择。这时,所有学校就在进行一场竞争。考生从每个可以选择的学校的吸引力分布中进行抽样,得到他对所有可选择学校的个人评价,评价最高的学校就会被考生作为入学学校,这个学校就赢了竞赛。如果不存在学生个人兴趣干扰的因素,赢了竞赛的学校比其他学校受欢迎就是一个合理推断。根据所有学生的录取结果,得到了每所学校获胜的场次,汇总所有考生的信息,就可以估计学校吸引力的情况。 多元比较统计模型文献主要讨论两两比较模型,在每次竞赛中只有两个选手参与,如国际象棋、球类比赛等。这类文献被广泛研究和应用,已经有大量的关于如何从竞赛记录推断国际象棋棋手能力高低以及对于球队排名的文献。在两两比较模型的文献中,根据分布的不同,有两类最为常用的模型假设。一类是Bradley- Terry模型,假设分布是第一类极值分布。在这个假设下,二元比较模型中就会导出Logit模型。另一类常用的分布假设是正态分布,这就是Thurstone- Mosterler模型。在实际中的两两比较数据时,这两种模型得到的结果没有太大的差异,利用第一类极值分布假设的模型更容易处理和计算。④ 在Avery等人研究美国大学排名时就是利用这个分布,我们也使用这个分布假设。需要说明的是,这里的极值分布或者正态分布假设,是考生对单个学校的吸引力个人看法的概率分布假设,不是对于所有学校的吸引力的分布假设。