中图分类号:G40-03 文献标识码:A 文章编号:1672-0059(2009)06-0015-05 一、教育研发体系的现状与变革力量 教育研发体系的目标是创造、组织和传播有关教育基本原理、体系和经验的知识和信息,以此联结和支持教育政策制定者和教育实践者提高教育质量、公平和效率。这有赖于教育研究、实践和政策制定三方面的合作支持和共同努力,以及教育研发体系内部各方的整合协同。然而,十多年来国内外对教育研究现实的主要批评是教育研究与教育实践和政策制定缺乏联系,且教育研发体系内部体系零散。例如,1995年经合组织(OECD)对成员国教育研发体系的综合评估报告指出,教育研发体系的问题是零散、过于政治化、与实践距离遥远并缺乏国际视野[1]。2003-2007年,经合组织对新西兰、英国、墨西哥、丹麦和瑞士五国的教育研发系统进行了系统评估[2-3],结果显示1995年报告中的主要问题依然存在:一是研发经费紧缺,例如上述五国投入教育研发体系经费仅占教育总支出的0.3%,而对于同为知识部门的医疗卫生部门,其研发经费则占部门总支出的5%-10%;二是教育研究不是缺乏新成果,而是没能很好地综合融会这些新知识、并将其切实应用于实践者和政策制定者的行动中。 2000年以来,三股新的国际力量进一步推动了全球教育研发体系的改革与提高。首先,社会对于教育研发体系的广泛关注引发各国教育研究界的反思。同时,随着全球化的发展和信息与通讯技术的进步,特别是网络技术和计算机数据处理技术的发展,教育研究者获得及处理教育信息和知识的能力快速提高,国际视野和跨国比较意识不断增强。联合国教科文组织、世界银行、经合组织等知识性国际性机构投入教育领域的研究扩大,在发展的主题下,联结了教育专家与其他领域专家在国际和比较教育方面的交流合作。20世纪90年代之前,国际和比较教育还是教育学内一项专门的学科,而在21世纪初的今天,新一代教育研究者几乎都会涉及国际和比较教育领域。这一方面造成了“比较教育的身份危机”,另一方面则推动着国际化的教育知识和信息的共享与合作研究,以及教育研究领域内部的融合与协调。 其次,各国政府管理教育系统的主要方式由法规指令制订逐渐转向目标与标准监控。这种监控日益强调问责制(accountability)原则,强调决策目标、责权与经费的统一,通过复杂指标体系所产生的事实性数据(evidence-based)来评估研究的质量和效益[4]。新管理主义(neo-managerialism)[5]在公共管理领域的盛行及教育经费的紧缺都是这种变化的重要推动因素。例如,2001年美国小布什政府提出的第一项内政措施是名为“不让一个孩子掉队(No Child Left Behind)”的《初级和中级教育法案》。该法案共110次提到了“科学的研究(scientific based research)”,指出联邦政府将根据一套明确的教育质量指标体系定期评估中小学校的表现,通过政策和经费杠杆对学校奖优罚劣。在高等教育领域,国家性的质量评估也迅速盛行。例如,20世纪80年代以来英国高校已开始通过研究实力评估(Research Assessment Exercise,RAE)竞争公共科研经费。2003年以来,RAE改革的重点是提高国家对高质量、实用性强的研究项目的支持力度,增加了考察研究成果对课程、教学和考评材料的支持度,并将科研成果的使用者加入RAE评审委员会[6]。2006年英国开始根据高校的RAE成绩及学科专业特点划拨研究生培养经费。此外,英国的高校评估还包括英国高等教育质量保证机构(Quality Assurance Agency,QAA)开展的本科院校评估和专业学科评估。这些评估研究很大程度上影响着这些高校获得人财物等资源的竞争力。 第三,政府的教育目标与标准监控也推动着大型国际教育评价研究的发展。例如,当前在全球范围内最有影响的跨国研究是国际教育成就评估协会(IEA)举办的“国际数学和科学能力进展研究(The Trend of International Mathematics and Science Study,TIMSS)”和“国际阅读能力进展研究(Progress in International Reading Literacy Study,PIRLS)”,以及经合组织的“学生教育水平国际评估(Program for International Student Assessment,PISA)”。每四年一次的TIMSS项目研究四年级和八年级学生数学和科学学科成就的国际发展趋势,参与的国家已由1995年的41个增加到2007年的60多个,并且对世界各国教育的影响日益增强。每五年一次的PIRLS项目研究测量儿童阅读能力,以及与读写能力有关之政策和实践的发展趋势。PISA研究经合组织国家15岁学生的阅读、数学和科学能力以及跨学科的基本学习能力。这些国际比较教育研究以规模大、周期长、综合型、组织严密而著称,产生了丰富的研究成果和深远的政策影响。最核心的是,这些研究项目建立起了大型的学习能力发展状况数据库,涉及国家在不同时期以及学生在不同年龄段获得有关数学、科学和阅读的概念及其相关学习的过程和态度,因而这些数据能够监控项目参与国的教学质量,帮助各国在与高水平的学习成就相关的关键因素上做跨国比较,如在教育政策、课程设置、教学方法、资源配置之间的比较等。例如,美国在1995年以来的历次TIMSS中都表现不佳,总体上美国学生的科学成绩优于数学成绩,低年级优于高年级。2003年,美国4年级学生的数学和科学成绩在25个国家和地区中分别位于12位和第6位,8年级在45个国家和地区中分别位于15位和第9位。这种实际表现与老布什政府提出的“使美国数学和科学教育世界第一”的目标相差甚远。对此,美国对TIMSS数据进行了较为深入细致的研究,产生了一系列具有深远政策影响的研究成果[7-10]。这些成果包括在国际数据比较中发现美国与世界的差距及问题,分析TIMSS中成绩优异的国家的相关教育特征,将TIMSS的评估框架运用于美国各州及各学区的数学和科学教育评价中,在国际比较的框架下诊断美国各地的具体问题,探索更具针对性的教育改革途径。