§0 引言 高等汉语水平考试〔HSK (高等)〕是为测试母语非汉语者的汉语水平而设立的国家级标准化考试,它与初中等汉语水平考试〔HSK (初中等)〕在等级水平上是互相衔接的。HSK (高等)包括客观性考试和主观性考试两种类型。客观性考试共有120题,分为听力理解、 阅读理解、综合表达三项。“挑错”就是综合表达所测试的项目之一。 作为HSK(高等)的一个组成部分, 挑错题是以考生“挑错”的方式来重点考察其语法能力。这里的“语法能力”含义较宽泛,它包括对语法结构、词语搭配、语体色彩、逻辑关系等多方面的错误的识别能力。挑错题的性质和任务决定了它的语料选择、命题形式、命题原则都有别于其它试题的一面。本文将通过对多套HSK (高等)试卷挑错题的考察与分析来探讨这几个问题。 §1 语料的选择 挑错题的语料将直接成为试题的四个备选项。命题者总是希望考生在选项分数上的得失能真实地反映其实际水平,即水平高的得高分,水平低的得低分。这就涉及到试题的区分度问题。测试所说的区分度是表示试题对考生水平的区分能力的指标。由于挑错题本身就是由其语料构成的,因而在这里,试题的区分能力实际上是通过语料的区分能力来实现的。按双列相关法计算的区分度指标,在0.4 以上的试题就是有区分力的试题。区分度越高,对考生水平的鉴别力就越强,因而也就加强了考试的信度与效度。那么,区分度比较理想的挑错语料在形式和内容上有什么特点呢?我们对历年的HSK (高等)正式试卷和预测试卷的挑错题进行了穷尽考察后发现,区分度(Discrimination)指标D≥0.3、难易度(注:难易度指项目的难易程度。这里是以通过每个项目的人数百分比作为难度的指标。)(Prop.Correct)指标0.3≤P≤0.7 的挑错题,尽管其语料选材范围不同,语体风格有异,但在形式和内容上却有下列共同特点,且区分度越高,这种特点就越明显。 1.1 结构规范 因为挑错题的语料将被划分为A、B、C、D 四个部分,直接成为试题的备选面,因此语料的句法结构是否规范至关重要。试想连汉语语法学界都有异议的句法现象,连汉语教材都回避解释的句法结构,要让考生来识别会出现什么样的情况?在预测卷中,曾有这样一道挑错题,A、B、C、D四个划线部分中,就因为A 项的句法结构不规范,导致多数高水平考生判定A项有错而丢分, 不少低水平考生却因猜对了B项而得分。结果这道题的通过率虽然为0.511,但其区分度指标双列相关才0.123,点双列相关才0.098,最后因其区分度远远低于预定要求而被淘汰。可见,语料本身的结构是否规范,会直接影响考生的判断,从而在分数上表现出得失,最终涉及到考试的信度与效度。 我们知道,HSK的语料取材广泛,不能只限于教材, 而高质量的报刊、杂志的作者又通常是以汉语为母语的人,他们的汉语写作能力虽然很强,但对汉语语法知识的运用却是“习焉不察”。有时,因为写作激情的冲动或是“意识流”的作用,他们会一味追求“达意”而忽视句法结构的规范,会过分追求“朦胧美”而使句法结构出现复杂的套叠、交错现象。这就要求我们命题人员要善于从题材的“汪洋大海”中,准确地发现那些结构规范、适合作挑错题的语料。 1.2 语句朴实 在我们的考察中, 区分度理想的挑错题语料往往语句都很朴实、易懂。这里因为挑错题的主要目的是考察考生的语法能力,而不是非语法能力。因此,挑错题的语料必须使考生的语法水平的表现尽量不受其非语法知识水平的干扰。在这方面,《语法等级大纲》(注:《语法等级大纲》是《汉语水平等级标准和等级大纲》的组成部分之一。)与《词汇等级大纲》(注:《词汇等级大纲》是《汉语水平等级标准和等级大纲》的组成部分之一。)的相互吻合、相互对应,为我们实现这种设想提供了可能,也为语料的选择大致限定了范围。过分生僻的汉字,过分雕琢的语句,过分深奥的语义,因其可能转移考生的注意力,干扰考生语法知识水平的发挥,而不适合进入挑错题语料。对历年HSK(高等)挑错题的考察也印证了我们的这一看法。 下面是正反两方面的例子: 在科教战线上,应该注意关心知识分子,信任知识分子, ①─────── ────────── ────── ABC 发挥知识分子的充分作用。 ────────────── (样题) D 例①的语句朴实、易懂,词义、句义对考生来说都没有什么障碍,考生能把精力集中在识别语法错误上。水平高的考生能比较容易地发现错处在D,水平低的考生识别起来却较困难。 这样就使二者在分数的得失上拉开了差距,从而保证了试题有良好的区分度。再如: 新画风的出现, 新境界的攀登,意味着画家新生命的开始, ②─────── ────── ──────────── A BC 高山仰止,予企望之! ────────── (模拟题) D 例②D部分语义太深奥,高水平考生也可能受其吸引, 做出错误判断,而把本来有错的C部分看成是对的。 这种并不反映考生真实水平的分数得失,会影响到考试的信度和效度。 1.3 分布合理 在HSK(高等)试卷中,挑错题一共只有十个,而命题者却希望通过考生在这十个试题上的分数得失,来估测考生的实际汉语语法水平。从统计学的角度来看,这就是样本与总体的关系。我们对考生实际语法水平的估测,实际上是通过语料的选择来实现的。从理论上讲,样本越大,对总体的代表性就越强。但事实上,我们不可能让考生在一次测试中做含有几百个语法项目的挑错题,而只能通过有限的语法样本来对其总体语法水平进行估测。这时,语料的选择是否有代表性,语法项目的分布是否科学、合理,就会直接影响我们对总体语法水平估测的可信程度。