从外部对高校的办学水平、教育质量进行综合评估,在我国已有近二十年的历史。但高校评估引起高校的普遍重视,并在学术界乃至社会上引发有关高等教育评估目的、功能、方法、效果的争议,从而受到社会的广泛关注,却是高校本科教学工作水平评估近几年全面推行以来才出现的。这表明,高校评估已经开始触动一些高等教育利益关系人的神经,其作用在不断增强,影响在不断扩大。但同时也出现一些对评估的非议。事实上,批评者指控的某些现象的确存在,反对者的观点并非全无道理,现行的高校本科教学工作水平评估确实存在一些需要认真研究改进的问题。 本科教学工作水平评估存在的问题 客观地说,中国高等教育评估经过二十年的发展,取得了很大成就。但也必须看到,现行的高校本科教学工作水平评估在评估方法论、评估体制和评估机制等方面,还存在不少亟待研究解决的问题。这主要表现在以下几个方面。 评估导向。普通高校本科教学工作水平评估是我国现行高等教育管理体制中体现国家意志的行政性评估,是国家加强对高等教育管理的手段。[1] 现行普通高校本科教学工作水平评估方案确立的评估体系,以国家管理高等教育的权力为基础,旨在贯彻落实国家对高等教育质量的认识和要求。[2] 这种单一的评估主体、统一的评估方案、划一的评估指标以及内容详尽等级分明的评价标准,使得评估对高校行为形成了强有力的约束,高校必须对评估方案规定的方方面面做出反应。在高校办学自主权尚未充分实现的条件下,这种评估实际上在技术上加强了国家对高等教育的控制,需要高校按照评估指标和标准的规定回应政府的质量要求,而不是面向社会自主办学。这种形式的评估是否有助于改进政府对高等教育的宏观管理?是否有利于培育高校自主发展的能力?能否为高校的持续发展提供足够的动力?这些都是旨在改善政府管理高等教育的职能,促进高校自主、持续发展的评估政策设计需要考虑的重大问题。 评估功能。本科教学工作评估的目的和指导思想是“以评促建,以评促改,以评促管,评建结合,重在建设”,[3] 但它的主要任务却是对高校的本科教学工作水平进行鉴定和分等,[4] 是一种典型的总结性评价。国内外高等教育评估的研究和实践均表明,总结性评价作为组织管理控制手段的功能很强,但作为组织自我检查、反思和改进工作手段的功能较弱。由于评估结果是将被评高校按优劣程度分等,并有意识地将分等的结果与决策挂钩,评估结果直接影响到高校的生存和发展,从而使现行的本科教学评估成为典型的“高利害评估”,任何高校都不敢有丝毫马虎。本科教学评估体系对总结性功能的强化,削弱了其形成性功能的发挥,造成了不少消极影响。评估过程中一些高校弄虚作假的现象,很大程度上就是由此造成的。因为在这种评估体制中,实事求是地报告自身的办学状况不仅得不到鼓励,反而会招致难以承受的惩罚。在评估过程中扬长避短、趋利避害,是任何一所高校必要的、甚至是必然的反应。 评估标准和评估技术。现行本科教学工作评估方案提供的评价标准,分为可通过数据核查的“硬标准”和只能依靠评估专家个人判断的“软标准”两大类。评估方案中的“硬标准”,体现了国家对我国普通高校本科教育必须达到的某些要求的强制性规定。这类标准旨在确保高校满足获得可接受的本科教育所必须具备的条件,它们更多的是影响本科教育质量的因素而不是办学质量本身。真正决定本科教育质量的,是办学理念、办学定位、办学过程和校内组织环境等软因素。但在评估方案中,体现对这些软因素要求的评估标准却语焉不详,失之抽象、笼统。而真正体现本科教育质量水平的学生表现标准,也缺乏可靠的衡量办法。由此造成了本科教学评估“软标准”评估技术发展困难。高校在接受评估的过程中,主要精力放在提供能够证明自己达到“硬标准”要求的证据上,而对于达到“软标准”要求的情况,由于标准的模糊性和相关评估技术的匮乏,只能笼统描述或通过个案加以说明,无法系统地提供可靠而有效的证据。因此,尽管评估过程非常强调“三个符合”,但如果最重要的评估标准含糊不清,缺乏必要的技术支持,如何合理地判断学校“三个符合”的情况?如何准确地评价本科教育的质量?如何据此做出决策? 评估结果。本科教学评估备受争议的问题之一,就是评估结果不合理,获得“优秀”结论的高校数量偏多。从2003-2005年3年中接受高等学校本科教学水平工作评估的171所高校的评估结论看,被评为“优秀”的高校有93所,占全部被评高校的54.4%。这一结果与“优秀”的定义显然不相符合。事实上,无论是基于国内高校生成的标准,还是基于世界其他国家高校产生的标准,无论是常模参照的评价,还是准则参照的评价,都不可能或不应该产生如此之多的“优秀”高校。如果大多数高校都是“优秀”的话,那么“优秀标准”事实上就是“常模标准”、“一般标准”。将“常模”或“一般”视为“优秀”,无助于提升高校的抱负水平,难以激发高校追求进步的动力,难以孕育有效的改进行为。事实上,从部分高校提交的自评报告中很容易看出,被评学校通常用绝大多数篇幅报告自己的办学成就,只用极小的篇幅泛泛地或轻描淡写地分析需要整改的问题。造成上述现象的原因,与评估方案和评估组织者的导向有关,与评估标准本身不够合理有关,也与评估专家的对评估功能的认知有关。可以说,正是评估方案本身的设计不完善导致了这一有悖于常识的评估结果。 评估效益。关于本科教学评估取得的成绩,已经有很多论述。不久前一次对被评高校有关领导、地方教育部门负责人和部分评估专家的调查显示,本科教学评估的必要性、评估结果的可接受性及其显著成效,几乎受到调查对象众口一词的赞扬。[5] 而且不出人意料的是,这些赞扬除了集中在办学条件改善这类最具体的“硬标准”外,还集中在如何促进学校的改革和发展等“软标准”方面。被评高校在软指标方面取得的“显著效果”,究竟是认识层面的还是实践层面的,是一次性的还是长期性的,往往是模糊的。而在最能直接体现高等学校本科教育质量的专业、课程、教师工作和学生发展方面,大规模的外部评估究竟取得了哪些效果,却很少有人能够提供系统的、直接的经验证据。另一方面,由于评估体系和评估方法不完善对高校工作带来的消极影响,却有不少言之凿凿的证据。从管理角度看,任何活动都需要考虑成本和收益,高等教育评估也不例外。评估效益评价是证明评估必要性、合法性以及不断改进评估效果的重要途径,对此,需引起充分的重视。