在教育科学研究中,主要有两种方法:一是基于经验和直觉之上的定性方法,一是基于理性和逻辑之上、借助数学工具而实现的定量方法。随着计算技术的不断发展,定量方法日益得到广泛的应用。定量方法具有哪些优越性和局限性呢?对此,笔者试图进行一些深入的思考。 一、定量方法是定性方法的重要补充 定性方法是一种基于经验和直觉之上的研究方法。在许多情况下,我们可以根据经验做出正确的判断,采取正确的教育措施。根据经验,教师知道哪些内容学生不易理解,需要反复讲解;知道只有保持教材的适当难度才能吸引学生的注意力;知道对女生要慎用批评,等等。这些基于经验的判断往往是正确的。但是,由于不同的研究者各自的经验、观点、倾向、偏好不同,有时候对同一问题会得到非常不同的结论。例如,学制是“六三三”好,还是“五四二”好?“集中识字”的教学法好,还是“分散识字”的教学法好?客观性选择题能否考察出学生的综合能力和写作能力?对于这一系列问题,不同的研究者的看法相去甚远,甚至截然不同,孰是孰非?仅凭各自的经验只会争论不休。为了支持自己的观点,双方都可以举出大量的个案,然而个案是不足为据的,几乎任何一个荒谬的命题都可能为自己找到个案的支持,如“牛有二个头”,“人有三条腿”等。即使在专家意见一致的情况下,也可能出现失误。“地心说”、“燃素说”、“绝对时空观”等许许多多最终被放弃的科学理论,都曾经得到专家们基本一致的认可。 这些时候,就需要借助定量方法,需要借助抽样调查、假设检验这样一些统计方法来做出判定。在这种情况下,定量分析可以帮助我们从各执一词的争论中摆脱出来。例如,通过对题目难度、区分度的统计,可以对试卷的质量作出较客观的判断。经常有这样的情况:统计分析发现,经过专家一致认可的题目区分度很低,甚至出现负区分度。当结果反馈给专家们后重新讨论时,专家们可能最后一致地认为:当初命题时忽略了某些重要的考虑。 对于学制、教材、教法、教育测量中的许多问题,如果我们仅仅停留在根据研究者个人经验的定性研究,停留在缺乏说服力的个案枚举,我们的研究就很难深入,我们就会争论不休。这时,定量分析可以帮助我们从这种各执一词的争论中摆脱出来。 二 定量方法可能被误用 定量分析不仅可以帮助我们防止重大的失误,而且可以帮助我们在互相对立和竞争的观点中做出选择。在这些情况下,定量分析具有重要的意义。然而,定量方法也很可能被不适当地运用,从而得到非常错误的结论。例如,通过对某校历届外国留学生汉语演讲比赛获奖情况的统计分析发现,在获奖者中,亚裔学生占70%,欧美裔占30%。据此,研究者认为,在汉语学习方面,与欧美裔学生相比,亚裔学生整体水平较高。进一步的分析发现,在所有参加比赛的留学生中,亚裔留学生占90%,欧美裔留学生仅占10%,亚裔留学生的获奖比例约为8%, 而欧美裔留学生的获奖比例约为30%。结论完全是相反的。 又如,一项关于教学方法的实验研究结果是:采用“结构法”进行教学的班级的汉语水平考试平均分为238.89,采用“功能法”进行教学的班级的汉语水平考试平均分为242.13。据此,研究者认为,“功能法”优于“结构法”。这一结论也是错误的。通过对两班学生成绩的t 检验得到的结论是:两种方法没有差异。分数差异是由随机误差造成的。 这类由于定量方法的不适当运用而得到错误结论的例子,在今天的教育研究文献中时有发现。之所以出现这类误用,原因就在于未能适当地把握定量方法运用的前提条件,就在于未能将定量分析建立在适当的定性分析的基础之上。事实上,任何数学工具都只有在一定的前提条件下才能应用。在自己所研究的问题中是否具备了运用某种数学工具进行定量分析的条件?这个问题,只能由研究者根据自己对问题情境的理解而做出定性的回答。例如,最简单的数学工具——加法就必须在一定的前提条件下才能应用。当我们运用加法来计算各科成绩总分时,就必须满足下列两个前提条件:①表现在不同科目考试中的能力具有代偿性,语文方面的不足可以由数学方面的优势来弥补;②不同科目的考试分数之间具有等值性,数学的10分恰好可以抵偿语文的10分。只有在这两个条件成立的情况下,才能运用加法。今天,由于这两个条件能否成立颇值怀疑,越来越多的人对在考试成绩的计算中运用加法计算各科成绩总分的作法提出质疑。 最简单的加法尚不能随便应用,其它更复杂一些的数学工具的应用往往需要更强、更严格的条件。定量分析如果不能基于合理的定性前提之上,就会被误用或被不合理地予以解释。 三、概率的逻辑基础 今天应用于教育科学研究的定量方法中,大部分是基于概率理论之上的,如数理统计。然而,概率理论能否应用于教育科学研究,尚是一个颇值怀疑和非常棘手的问题。何谓概率?通俗讲即“重复试验中事件发生的可能性”。对于概率概念,“重复试验”是一个非常重要的前提。例如,只有多次重复抛掷硬币,才可能得到正面朝上的概率。倘若是不可重复的试验,倘若每次抛掷都会使硬币的重量、质地、成分、形状等发生变化,就无所谓概率。教育研究的对象是人,每个人不仅具有不同的遗传特点,而且经历、需要、欲望、情感、能力水平等各异。对不同的人进行的试验、观察或调查能否被视作重复试验呢?能否被视作与将一枚硬币多次抛掷相似的重复试验呢?这个问题的答案至少不是不言而喻的。退一步,既使我们接受了对人可以重复试验的观点,这种基于概率基础之上的统计规律性能否成为关于有个性的人的教育决策的依据呢?这仍然是一个值得怀疑和需要讨论的问题。即使根据我们的调查知道具有某一组神经生理特点的人中有90%难以完成某一水准的学业,我们能否根据这一研究结果而预言一个具有这些神经生理特点的人不能完成学业呢?这里,人的能动性是一个不容忽视的因素。不用说预言一个具有能动性、选择性的人,即使是从大量抛硬币中得到的统计规律,对于预测下一次抛掷硬币的结果也是毫无意义的。