一、引言 经济学研究强调变量间的因果关系(刘晓罡和柏璐,2023)。理论分析中内生与外生变量的区分是由整个研究对象系统中变量的关系决定的,而在经验研究中,由于遗漏变量、测量误差或自变量和因变量相互决定等原因,自变量的严格外生是很难做到的。因此,实证分析要花费大量的精力来处理自变量的内生性问题,也即因果关系的识别。比如,在考察教育对个体工资水平的影响时,由于难以控制个人能力,教育与工资水平之间的相关性可能并非因果关系,而是因为高能力者的教育水平和收入都更高(Angrist和Krueger,1991;Card,1999);在考察制度对经济表现的影响时,一些不可观测的因素可能同时影响制度和经济增长,此外,经济表现也反过来影响制度(Acemoglu等,2001);再比如,在评估最低工资政策对工资差异及贫困发生率的影响时,尽管最低工资标准由政府设定,具有一定的外生性特征,但仍难以彻底摆脱遗漏变量和反向因果关系的干扰(刘贯春和张军,2017;张凡等,2022)。在针对上述问题的实证研究中,普通最小二乘(OLS)回归可能无法正确地估计出自变量对因变量的真实影响。 在这种情况下,工具变量方法是解决内生性问题行之有效的方法之一①。在主要的回归方程系统之外,寻找一个或多个外生变量作为工具变量,应同时满足如下两个条件:首先,工具变量与内生自变量有关(相关性条件);其次,它与影响因变量的不可观测因素无关(有效性或外生性条件)。换言之,如果工具变量对因变量有影响,它只是通过内生自变量发挥作用。如果工具变量不满足上述条件,采用工具变量相关方法所得结果的偏差甚至高于OLS回归。在操作层面,验证相关性相对容易,研究者只需要用内生的自变量对工具变量回归,通过某些统计量(如F值)来判断工具变量是否会对内生自变量产生足够强的影响②。遗憾的是,关于工具变量外生性的验证要困难得多。 在工具变量与内生自变量数量相同(即恰好识别)的情况下,我们只能依靠常识或旁证来说明工具变量的有效性。这是因为,模型中的扰动项是无法观测的。上述判断是很多计量经济学教科书中明确给出的结论③。然而,一种看似合理的统计检验方法时常出现在一些国内权威期刊发表的研究中。该方法将工具变量放入实证研究的核心回归方程,通过OLS回归中工具变量的系数显著性来判断其是否有效。其思路大致如下:如果工具变量有效,那么它只通过影响内生自变量来影响因变量;回归方程中同时放入内生自变量和工具变量时,工具变量通过影响内生自变量来影响因变量的效应将完全被内生自变量的系数捕捉,工具变量的系数就不再显著④。本文认为该方法是错误的,其迷惑性在于:一方面,使用假想正确的因果关系来推断,工具变量的因果作用在控制内生自变量时会消失;另一方面,却在自变量的内生性依然存在的情况下使用OLS来估计工具变量的偏效应。然而,在存在内生变量时,所有自变量(包括工具变量)系数的OLS估计都是不一致的,此时工具变量系数的显著性不能作为判断其真实偏效应是否消失的依据。 除了理论上的探讨,本文还进行了数据模拟分析。我们利用特定的数据生成过程,模拟生成了工具变量、核心自变量和因变量,这使我们在进行回归之前便了解变量之间的决定关系以及模型中的真实参数。在已知工具变量是否有效的前提下,我们再来考察上述检验工具变量外生性的方法是否合理。多次模拟的结果表明,在工具变量只通过核心自变量来影响因变量的情况下将其放入回归方程中,仍然有非常大的概率得到显著的估计系数;而在工具变量同时与核心自变量和遗漏变量相关的情况下,控制工具变量也有较大概率得到不显著的系数。而使用不满足外生性的工具变量进行两阶段最小二乘(2SLS)回归,所得到核心自变量的系数偏差远高于OLS回归,说明上述工具变量外生性的检验方法很有可能误导对工具变量外生性以及最终实证结果的判断。 在存在内生性问题时,一大类中介效应模型的误用误读也可以利用本文的分析框架进行阐释。此时,一个理想的工具变量对因变量的影响可以被视作处置效应;该工具变量只通过核心自变量对因变量产生影响,因此核心自变量也是中介变量。按照中介效应模型的思路(也是在回归中加入工具变量来验证工具变量外生性的思路),加入核心自变量后,工具变量的影响应该变得不显著。本文的分析表明,实际情况并非如此。当中介变量与模型中的扰动项存在较强的相关性时,中介变量和处置变量(工具变量)的系数都是不一致的。 本文的工作澄清了工具变量使用过程中一项易犯的错误。这种错误做法近些年来被频繁使用,往往导致相关研究得出误导性的结论。已有研究发现,由于弱工具变量、模型设定错误等原因,工具变量方法得到的系数绝对值通常大于OLS估计结果,从而带来更大的偏误(Jiang,2017)。本文为此提供了一个新的解释——对工具变量外生性的错误判断。本文对计量经济学的教学也有启发意义。利用数据生成过程得到数据,再用这些数据进行各种回归,有助于理解不同计量方法所引致的结果变化。 本文结构安排如下:第二节简要阐明遗漏变量带来的内生性问题,以及理想的工具变量如何解决该问题;同时说明在恰好识别的情况下,无法对工具变量进行外生性检验。第三节通过模拟的方式说明,将工具变量放入主回归方程中进行OLS回归无助于判断工具变量是否外生。在此基础上,第四节指出使用不当的中介效应模型与对工具变量进行统计检验的错误做法有相似之处。第五节结合已有的实证研究,探讨了工具变量使用过程中轻视系数经济意义解读的问题。使用工具变量方法所得到的参数通常与OLS估计结果相差很大,这些差异没有引起研究者的充分重视,这也与对工具变量外生性的错误判断密切相关。第六节总结全文,并给出了一些操作层面的建议。