我国高校教学评估工作始于20世纪90年代,历经25年,期间先后开展过合格评估、优秀评估、随机评估、水平评估、审核评估等几种不同形态的评估。但若从评估规模、效果及其影响来看,毫无疑问当以水平评估与审核评估最为典型、最具代表性。前者全称“普通高等学校本科教学工作水平评估”,习惯上也叫首轮水平评估,自2003年开始至2008年结束,6年间共评估589所高校。后者全称“普通高等学校本科教学工作审核评估”,实际上是第二轮评估,开始于2013年,将于2018年年底结束,630余所高校参加,包括了接受过首轮水平评估的所有高校。在笔者看来,审核评估与水平评估,既一脉相承,又有创新与发展。就此而论,审核评估之于水平评估,不是简单地换个名词或改一种称谓,实际上,在评估理念、标准、内容、方式、技术及组织等方面相应做了一系列调整和变化,表明我国对评估工作或评估制度在理论上有了新认识,在实践上有了新进步。审核评估全面总结和借鉴了水平评估的经验,深入反思并汲取了水平评估的教训,是我国高校教学评估实践的新探索,更是教学评估理论认识水平的新提升。 一、教学评估理念:从强调绩效问责走向注重协商对话 教育评估或评价活动既古老又年轻。言之古老,是因为自教育产生时起就存在着评价。孔子就曾讲,听其言观其行而后知其人。苏格拉底也提到,未经反思和评判的生活没有意义。说它年轻,在于作为一门学问和一种制度,教育评估评价只是在20世纪初才得以确立,并且在很大程度上受益于工商业发展以及现代企业质量管理理论与实践的启示。在19世纪前的西方社会,高等教育的标准与质量多由大学内部掌握和控制,政府及社会很少关心和过问。随着高等教育规模不断扩张,入学人数不断增多,大学从过去教会和私人领域逐渐变成国家和社会的公共事业,高等教育也由远离社会一步步走到社会的中心,其事业的发展和扩充,越来越依赖于政府和社会的财力支持。20世纪70年代之后,西方国家先后进入高等教育大众化阶段,政府财政投入吃紧且呈减缩态势,相应地,个人教育成本负担增加。在此情况下,无论是政府还是社会与公众,普遍关注教育质量,要求大学对质量做出承诺,由此开启了政府和专门机构主导下的高等教育质量外部问责和绩效评价时代。西方主要国家纷纷制定高等教育质量标准,颁布质量法律,建立质量评价制度,成立质量评价机构,开发质量评估工具,开展质量评估认证活动。有些国家还开展双边或多边高等教育质量相互认证工作,区域性乃至国际性高等教育质量组织得以成立,掀起了大规模国际高等教育质量保障运动。所有这些,对改进高等学校工作、提高高等教育质量具有不可替代的作用。 在世界高等教育质量保障运动大背景下,20世纪80年代中期,我国高等教育质量保障工作亦提上议事日程。1985年,《中共中央关于教育体制改革的决定》首次提出,政府要对高等学校办学水平和教育质量进行评估。此后,教育部在工科高校数百个专业进行了教学评价试点。20世纪90年代,教育部将专业评估转入院校整体性教学评估。1994年,国家对改革开放后批准设立的高校本科教学工作开展合格评估;1996年,开始对那些申请进入国家“211工程”重点建设项目的高校本科教学工作开展优秀评估;1999年,对其他普通高校本科教学开展随机性水平评估。这三种评估工作均持续到2002年,总计评估254所高校,其中以接受合格评估的高校最多。2002年,教育部将三种评估合并为普通高等学校教学工作水平评估,即首轮教学水平评估,从2003年正式实施。虽然此前的三种评估被合并为一种评估,但其在评估思路、评估方案等方面并没有多少实质差别,可视为同类性质的评估模式。 指导首轮水平评估(包括之前的评估)的基本理念与思想,就是人们耳熟能详的评估十六字方针:“以评促建、以评促改、评建结合、重在建设”。随着实践的深入,再增加“以评促管”,发展为评估二十字方针。不管是十六字还是二十字,都代表了那个时期人们对评估理念与功能的总结和概括,反映了人们对评估本质、价值及目的的基本认识和理解。 透过首轮教学水平评估以及评估方针,我们不难发现,教学评估主要是由政府直接组织的,当然要体现政府的意志和意图,体现政府对高等教育质量的问责,评估是为政府对高等教育及其质量实施有效管理和监督服务的。通过评估,政府可以检查高校教学工作是否符合、贯彻和落实了党和国家有关教育方针政策及法律法规要求,检验高校教学效果是否达到了政府规定的质量标准,督促高校进一步加强教学建设、改进教学工作、提高教学质量。为实现上述目的,政府制定了教学评估指标体系,规定了评估标准和评估具体要求,其中不仅有量化指标,还要区分出评估结果等级序列,进而使高校教学与人才培养工作变得可观测、可衡量、可检查、可比较、可参照,进而与一定的奖惩政策制度衔接。 政府对高校教学质量进行问责评估本为分内之职,制定评估标准也是法律赋予的权力,但政府并不是质量问责和评估的唯一主体,否则就会否定和排斥其他组织或群体的价值存在,甚至在某种程度上造成评估本质扭曲、评估目的错位和评估功能变形。事实上,现代高等教育是一个巨大的利益共同体,政府、高校、社会、公众、媒体、家长、学生、校友、用户等诸多群体都有着各自的利益需要和价值诉求,也有着不同的评价标准,高校教学工作评价也是如此。由此,当前国际上出现了所谓的第四代评估理论。这种评估理论认为,先前评估所经历的三个发展阶段(学业测量、实情描述和效果判断)都是理性主义、实证主义、管理主义和功利主义的产物,它们均将评价对象看作被动存在者,评估成了一种权力对另一种权力的压迫、规约和限制。第四代评估理论宣称,评估不是为了检查和证明,不是为了单纯测量和判断,而是为不同利益主体提供平等交流和协商对话的平台;评估是交流对话的机制,是各利益主体相互间围绕着质量与改进所展开的建构性评价活动,评估本身不存在确定性的单一量化标准[1]。第四代评估理论受到各国评估界的高度重视,并以此为指导改进评估认证与质量保障工作,其中众所周知的学校主体、自我评估、持续改进、发展性评价、过程性评价等,就是这一理论的重要表现形式。