0. 引言 陈宏(1997a;1997b)对语言测验里的结构效度问题做了深入的讨论。本文拟就这个问题再说几句。我们准备讨论以下三个问题:1.结构效度概念的形成及其背景;2.有关结构效度的讨论;3.目前对结构效度的认识和我们的看法。 1. 结构效度概念和它出现的背景 1.1 结构效度概念 结构效度概念是Cronbach和Meehl在1955年的一篇文章中首次提出的,这个概念一提出,就成了美国心理测量协会的一个行业标准,同时,结构效度也成了心理测验和语言测验追求的一个质量标准。结构效度的一个标准表述见于《心理学大词典》(朱智贤主编1989):“结构效度亦称构想效度,或概念效度,即测验在多大程度上正确地验证了编制测验的理论构想。一套测验的编制,往往要对所测量的心理特性提出一种理论上的设想,依此编制测验,然后检验测验结果在多大程度上符合构想的理论。”结构效度概念提出四十年来,对它的讨论、批评乃至误解层出不穷。 1.2 哲学背景 结构效度理论是在逻辑实证主义影响下产生的。Messick(1989)说,“结构效度概念在50年代初被系统化,当时,在心理学,特别是在方法论方面,逻辑实证主义是一种起主导作用的势力。因此,它提供了一个现成的框架,效度概念在这个框架中形成并得以合法化,就是必然趋势了。”对结构效度理论产生了直接影响的是亨普尔(Hempel,C.G.)。亨普尔提出了两个模型,一个叫“演绎规律说明”模型(deductive-nomological model,简称D-N模型),一个叫“归纳统计说明”模型(inductive-statistical model,简称I-S模型)(罗嘉昌1996)。按照亨普尔的观点,“整个系统(指理论系统——笔者按)浮在观察层面之上,而又靠转译规则与其相连。这可以看作是一些纽带,它们虽然不是网络的一部分,但却使网络上的某些点与观察层面的特定部位相连接。由于可通过这些联系进行转译,则这个网络可起到一种科学理论的作用:从某些观察数据,通过一条转译纽带,我们可以上升到理论网络的某一点,通过另外一条转译纽带,我们可以再回到观察层面。”(亨普尔1952,转引自Messick 1989)亨普尔这段话有助于理解结构效度概念。 1.3 建立结构效度理论 Cronbach和Meehl把亨普尔的理论引进心理测量领域。他们认为,“要建立一个测量结构的测验,就要求有一个严格的(虽然可能是概率上的)推论环节。要证明一测验有效地测到一个结构,就一定得有一个围绕着概念的定律网络。”换句话说,“一结构可被科学地接受的必要条件是,它必须存在于定律网络之中,至少其中的某些定律要包含可观察的东西。”(Cronbach & Meehl1955,转引自Messick1989)于是,Cronbach(1971,转引自Messick1989)说,“结构效度理论,是按科学哲学的正规方式表述的。” 在测验中建立结构效度的大致过程是:(1)提出一个假说性结构,假设用它来解释测验表现;(2)从产生结构的理论中推导出关于测验表现的一个或几个假设;(3)用逻辑的和经验的方法对假设进行检验(Popham1988)。如果测验结果出现了我们假设的行为,那么测验就是有效的,同时,我们的理论假设也得到了证明。 1.4 关于“结构” 在心理学中,像“焦虑”、“能力”等概念都是“结构”;在语言测验领域,“语言能力”、“交际能力”、“熟巧程度”也都是“结构”。这些概念“描述的不是一个行动,而是思想、行动特有的组织和效率。”(Cronbach1990) 为什么要使用“结构”这个词呢?Cronbach(1971)解释说,“我们可以使用概念这个术语而不使用结构,但后一术语在于强调那些范畴是一些精心创造的产物,可以用来把经验纳入具有定律性质的普遍陈述。”(转引自Bachman1990)这就涉及到“结构”(construct)这个词的本义。construct来源于construe,前者的一个意思是“思维的产物”,而后者的意思是“解释”。因此,“一个结构就是以一种方式对观察到的东西进行解释——即把观察到的东西组织起来。”(Cronbach1990) 1.5 结构效度的特殊性 在测验理论中,有好几个效度,如内容效度、预测效度、效标关联效度等,这些效度指的都是测验的性质。结构效度和它们不一样,它不仅指测验的效度,亦即平常所说的“是否测到了要测的东西”,而且它也指理论假设是否得到了经验数据的证明。因此,结构效度既和观察层面有关,也和理论层面有关。这样我们就可以大致理解Cronbach把亨普尔的理论引进测验的理由,也可以理解他何以要使用“结构”而不使用“概念”。 2. 批评和讨论 结构效度理论提出以后,结构效度问题就成了心理测量和语言测量里的最重要的问题,凡是涉及人的心理特质和深层能力的测验,无不追求结构效度。但同时,对结构效度理论的批评也不断出现。在这些批评意见中,人们并不是要否认结构效度对测验的重要,而是说结构效度理论(尤其是早期的)有这样或那样的问题。 2.1 关于定律网络 当Cronbach和Meehl引进亨普尔的理论,把结构效度理论作为一个定律网络提出来后,人们就对这个东西提出批评,原因是人们不理解这个东西,用Cronbach(1989)的话说,“很多人被这个哲学原理搞懵了。”我们刚才说过,Cronbach和Meehl是想按实证主义思想使心理测量学获得一定的理论高度,因此,Meehl和Golden(1982)对这个思想又做了进一步的解释:“理论概念是在一个定律或统计‘规律’的网络中获得定义的,对其进行定义的正是这些概念在网络中的作用,而这种定义是概念化的或含蓄的。概念的意义部分地来自理论框架自身,而不论这框架可能是多么地脆弱和单薄。说到一个实体,你是根据有关它的理论陈述在何种程度上与观察陈述相连而得知其意义的。这些陈述是说它在哪儿出现、它有何影响、它会如何以及它由什么组成。这些特性只有极少数是可以直接观察的。”(转引自Cronbach1989)Cronbach(1989)说,这个理论的“理想是把科学知识‘重建’为一个演绎系统。一个概念可视为有定律性质,仅当其被放入‘一个已建好的科学演绎系统’,同时,仅当其陈述了何处出现某条件,就会发生某事时,它也就具有定律性质。即使在50年代,哲学家也是很谨慎地说,这类系统只能近似地得到,只能在成熟的科学中得到,而在心理学中,这种强式理论最多是遥远未来的希望。”因此,“把结构效度与演绎连在一起,是一个策略上的错误”,并且,“给不成熟的科学穿上实证主义外衣是矫饰的,而说结构若不是定律网络的一部分就不可科学地接受,则是自拆台脚。”(Cronbach1989)