中图分类号:G40-059.3 文献标识码:A 文章编号:1003-7667(2015)10-0001-05 随着互联网和信息技术的发展,大数据正在影响着政治、经济、教育、科技、文化、医疗等社会生活的各个领域。为了应对大数据的挑战,各国纷纷将大数据研究提升为国家战略,例如,美国政府在2012年3月29日率先发布了《大数据研究和发展计划》,决定投资2亿多美元开展大数据研究。大数据将改变人们的生活、工作和思维方式,就科学研究来说,大数据将引发科学研究范式的转变。 一、大数据时代的科学研究范式及其对比较教育研究的挑战 “范式”(Paradigm)是由科学哲学家托马斯·库恩(Thomas S.Kuhn)于1962年在《科学革命的结构》中提出的一个概念。他认为:“范式有两种意义不同的使用方式。一方面,它代表着一个特定共同体的成员所共有的信念、价值、技术等构成的整体。另一方面,它指谓着那个整体的一种元素,即具体的谜题解答;把它们当作模型和范例,可以取代明确的规则以作为常规科学中其他谜题解答的基础。”[1]在科学研究中,存在着不同的范式,正是这些不同的范式为人们提供研究的视野和参照框架,规约着研究者的信念、规则和技术。范式是多元的,也是历史的、发展的,带有时代的烙印。科学技术的发展过程总是伴随着以新的信念、规则和技术取代另一种信念、规则和技术,即旧范式的崩溃和新范式的崛起,也就是库恩所说的“科学革命的结构”。 (一)大数据的内涵及其对科学研究范式的影响 大数据是什么?美国麦肯锡全球研究所是这样描述的:“大数据是指规模超出了典型的数据库软件工具的捕获、存储、管理和分析的能力的数据集。”[2]一般来说,大数据的特点可以概括为4个"V"。(1)数据体量浩大(Volume):与传统数据不同,大数据的总量巨大,可以产生于机器、网络和人的行为。(2)数据类型多样(Variety):类型包括结构化数据、半结构化数据和非结构化数据,且来源多样,给储存、挖掘和分析数据带来了困难。(3)数据生产速度快(Velocity):大数据的快速增长要求快速、持续的实时处理,实时数据帮助研究者和商业做出有价值的决策。(4)数据价值大(Value)但密度低:大数据具有极大的潜在价值,但数据价值的密度较低。 大数据时代的到来使得科学研究范式发生了变革。美国学者吉姆·格雷(Jim Gray)提出了科学研究的第四范式,即数据密集型科学研究(Data-intensive Science Discovery)。他认为迄今为止科学研究范式包括四个:(1)几千年前科学是经验主义的,主要研究方法是描述自然现象;(2)几百年前科学出现了理论分支,开始利用模型和归纳开展研究;(3)几十年前科学出现了计算分支,开始模拟复杂的现象;(4)今天科学出现了数据爆炸,开始把理论、实验和模拟结合起来。[3]也就是说,科学研究范式经历了经验科学、理论科学、计算科学到数据密集型科学的发展过程。吉姆·格雷这里所谓的范式与库恩的范式并不是同一个概念,他揭示的并不是科学研究的具体范式,而是一个时代科学研究的总体特征。 (二)大数据时代科学研究的基本特征 大数据作为科学研究的重要资源和动力,必然对科学研究产生深刻和深远的影响,基于大数据的科学研究也呈现出区别于其他类型科学研究的一些特征。 第一,科学研究的全样本性。在大数据时代,科学研究数据的数量和规模快速增长,类型多样。以往的科学研究数据来源于样本,抽样的数量和代表性会影响研究结果的质量。大数据不受样本选择的影响,科学研究可以处理和某个现象相关的所有数据,发现数据背后的规律性和建构意义。 第二,科学研究注重研究的效率,而不是研究的精确度。大数据时代,由于数据规模比较大,科学研究可以允许些许的不精确性和误差,追求的是科学研究的混杂性。“我们掌握的数据库越来越全面,它不再只包括我们手头现象的一点点可怜的数据,而是包括了与这些现象相关的大量甚至全部数据。我们不再需要那么多担心某个数据点对整套分析的不利影响。我们要做的就是要接受这么纷繁的数据并从中受益,而不是以高昂的代价消除所有的不确定性”。[4] 第三,科学研究中相关和因果的复杂性。传统科学研究主要通过逻辑推理来揭示变量之间的因果关系;大数据时代,科学研究不再仅仅探求难以捉摸的因果关系,主要通过统计分析海量数据中的相关性来寻找事物发展中的规律性。正如有学者指出:“大数据研究不同于传统的逻辑推理研究,而是对数量巨大的数据做统计性的搜索、比较、聚类、分类等分析归纳,因此继承了统计科学的一些特点。统计学关注数据的相关性或称关联性,所谓‘相关性’是指两个或两个以上变量的取值之间存在某种规律性。”[5]大数据时代的科学研究模式可以通过相关研究作因果关系解释,这种研究不同于传统研究中的描述性和叙事性解释。 (三)大数据时代对我国比较教育研究范式的挑战 在大数据时代,我国比较教育研究范式面临两大挑战。一是如何确立科学的研究范式。按照库恩的范式理论,我国的比较教育研究范式还处于一种比较朴素的发展阶段,还没有形成严格的范式,对此本文将在后面对比较教育研究范式存在的问题进行详细的分析。为此,我国比较教育研究范式需要“补课”,做到按照一定的范式开展研究,实现研究的“科学化”、“规范化”。二是适应大数据时代的要求,加强大数据的采集、处理和分析,提高研究的效率和意义建构水平。这两个挑战交织在一起,无疑对我国的比较教育研究者在研究范式方面提出了很高的要求。 二、大数据时代我国传统比较教育研究范式存在的问题