中图分类号:G647 文献标志码:A 文章编号:1008-4339(2008)04-0335-04 一 自1985年《中共中央关于教育体制改革的决定》颁布以来,我国有组织的高等学校教育评估已经走过20余年的历程,取得了令世人瞩目的成就。研读这段历史,不难发现一个耐人寻味的事实:评估在努力实现科学化的过程中,始终在追求并沿着简易可行的轨迹发展。研究和经验都表明,评估只有简易可行,使用方便,才能获得广泛的应用,才能得到持续的改进,才能不断降低成本、提高效益,才能更加科学合理,成为最有效的现代教育管理方法。 教育评估毕竟是对最具复杂性特征的教育活动及其效果做出客观准确的分析和判断,人认识能力的局限性和客体的复杂性决定了主体认识客体的本质需要经多次由浅入深、由表及里、由此及彼、去伪存真的反复。这一过程是复杂的、艰难的、长期的,但一旦突破,抓住了事物的内在规律,就有可能使认识过程和方法变得简化,容易操作。就像奥卡姆剃刀定律表明的“把事情变简单很复杂”,教育评估简易可行性的每一次提升,都是理论研究者和实际工作者努力攻关的成果,都是理论认识的深化和实践经验的丰富。 从高校教育评估实践的历程可以比较清楚地看到,追求和实现简易可行既从一个角度推动了高校教育评估的发展,也成为高等教育评估发展的成果。 1985年6月黑龙江省镜泊湖召开的高等工程教育评估专题讨论会上提出的学校办学水平评估指标体系的末级指标最多达198条[1]。因每一指标信息的采集和处理均需要一定的工作量,所以实际上很难操作,需要将其简化。同年11月,原国家教委高教二司在《关于开展高等工程教育评估研究和试点工作的通知》中提出的高等工业学校办学水平评估指标体系(草案),其末级指标减至72条。1987年1月同济大学建议将高等工科院校分为三类,分别制定评估指标体系,并在针对第一类院校评估方案中,将末级指标减至40条[2]。 1988年,一些学者在对上海市和原煤炭工业部组织的高校办学水平评估试点实践的思考中,提出对高校实行“分类评估”[3],强调要制定一套“简”、“要”、“实”的指标体系,并分析比较了中、美、苏三国的情况[4],还建议评估所需数据可以从国家有关部门颁布的数据中直接选取,以简化评估过程[5]。 在同一时期,上海市高教局组织实施了对新建高校合格评估的试点[6]。在实践和探索中逐步认识到,合格评估的重点是“两基”(基本办学条件和基本教学质量),这样既能抓住主要矛盾,取得实效,又可简化评估指标体系,使评估简易可行。 1992年,原国家教委直属司在组织制定高校办学水平综合评估方案时[7],吸收被评学校代表参加,当面听取了学校代表对评估目的、目标、指标、标准、程序的意见,使方案更为合理、简单、可行,同时也大大有助于降低“防卫心理”。 1993年,原国家教委高教司将对高校全面评估调整为教学工作评估,既缩小了评估范围,减少了评估的工作量,又抓住了学校工作的关键,切实有力地促进了学校的建设。随后,又进一步将教学工作评估细分为针对新建院校的合格评估、针对“211”工程学校的优秀评估和针对介于前两者之间的随机评估。在合格评估中,按照当时学校情况,分别研制了适用于综合、工科、农林、医药、财经、政法、外语、师范、民族院校的九种评估方案,评估指标分别简化为 22到40个之间。更有价值的是,评估过程和评估结果为教育行政部门分门别类地加强和改善对高校的宏观管理和宏观指导提供了有益的经验。 在追求教育评估简易可行的过程中,评估标准和权重设置也发生了微妙的变化,而且基本上是与指标体系简化同步进行的。除了对绝对标准选择要兼顾国家要求和高校实际情况,相对标准更加注意“参照群体”的准确性外,本科教学工作合格评估有的方案只给出合格标准;在设计A、B、C、D四个等级标准的方案中,也只给出A、C两个等级标准,介于A、C之间的为B级,达不到C级为D级。这些看似不起眼的变化,却使评估操作更加简易,便于改进。 权重历来是评估方案设计、评估实际操作、评估结论解释时,容易引起争议的焦点之一。众所周知,教育评估指标之间等质性很弱,为了满足特定需要常需将指标做准等质化处理,增加可比性。在此基础上设计的权重,往往因受到人的认识、价值取向和技术方法的限制,而不能准确反映指标之间的相对重要性。为了避免不必要的歧见和影响,一些合格评估方案根据目的和功能要求不再设置权重,有的则采用设置边界条件等方法替代权重,收到了令人鼓舞的效果。 二 从发展的角度看,我国有组织的高等教育评估还处在初级阶段,如何使评估更加简易、可行、有效,仍有相当大的难度。这就需要进行更深入的理论研究和更多的实践探索,整体水平才有望提升到新高度。应对这一挑战,需从五方面寻求最佳解决方案。 1.明确评估的具体目的 评估目的直接影响评估方案设计、评估程序确定、评估结论及其公布方式、评估专家选聘、评估成本预算、评估质量和有效性的评价,不可谓不重要。 评估目的有直接目的和终极目的之分[8]。前者比较具体、行为化、可操作,基本上可以观察和测量结果。如,合格评估的目的是保证学校的基本办学条件和基本教学质量达到(最低)标准;后者则往往涉及面更广,比较抽象、概括、原则,一般需要较长时间才能实现,而且难以直接对结果进行观察和测量。如,CIPP模式的创始人斯塔弗尔比姆提出的“评估的目的不在于证明,而在于改进”,就是指评估的终极目的,很难成为某一次评估活动的具体目的。