实验作为一种重要且经典的科学研究范式,在经济学各领域中已得到广泛应用。自Smith(1962)采用规范的受控实验研究了竞争市场中个体的经济行为,伴随着博弈论和行为经济理论的深入发展,基于实验的理论探索和实证研究发展迅速,越来越多经济学者采用实验方法检验经济理论、探究新的经济规律。实验所具有的可控制性常被用于处理现实中因个体自选择、遗漏变量等带来的内生性挑战,有助于更准确地探究事物间的因果关系,从而也能更有效地指导政策的制定、评估和改进等重要实践。实验的基本类型分为实验室实验和实地实验。前者一般具有更强的可控制性,内部有效性更高,但因其样本代表性和场景真实性不足以及实验参与者的被审查感等原因,其外部有效性常常受到质疑;后者则能够在保证内部有效性的基础上,有力地提高外部有效性。审计实验是实地实验的一种重要类型(Harrison和List,2004),其特点是通过将拥有一个或多个干预特征的真实或虚拟个体随机指派到诸如劳动力市场、零售市场、医疗市场等特定的现实情境,来识别这些特征对市场各方所受待遇以及后续结果的因果影响。审计实验能够在确保被审计者在对被审计不知情的现实情境下开展实验干预和数据收集,避免被审计者因知情而产生有关自身利益、社会形象等额外考量从而有意或无意采取非自然或欺骗行为应对审计而导致的数据失真,故能够观察到被审计者真实可信的行为反应。鉴于审计实验的上述核心优势,该方法常常被用于研究歧视、委托—代理等具有较高私密性和敏感性的经济学核心议题。 以广泛存在于劳动力市场及零售、租赁、婚恋等各类市场和经济活动中的歧视问题为例,自从加里·贝克尔(Gary Becker)的开创性研究至今(Becker,1957),歧视问题已成为过去半个多世纪经济学研究的核心领域之一。其中,劳动力市场中的歧视特别受到经济学家的关注,他们尝试从经济学视角解释劳动力市场中许多群体遭受不平等待遇的原因,并提出相关政策建议,以改善劳动力市场中求职者由于性别、种族、性取向、残疾等因素而遭受雇主歧视的现象。早期有关歧视的研究主要基于观测数据估计市场歧视程度,探究各类歧视所产生的影响等(Madden,1987;Oaxaca和Ransom,1994;Lang和Manove,2011)。鉴于采用观测数据的研究常常难以完全处理诸如遗漏变量、反向因果、样本选择等原因所带来的内生性,基于实验方法探究歧视的研究因具有清晰识别因果关系的优势而得以迅速发展。近年来,有学者采用实验室实验,通过雇主或雇员的角色模拟(Lippens等,2021;Lahey和Oxley,2021)、公共品博弈(Castillo和Petrie,2010)、信任博弈(Fershtman和Gneezy,2001)和最后通牒博弈(Ferraro和Cummings,2007)等各类博弈互动来研究人们的歧视和偏见行为。而相比于实验室实验,在各种现实情境下的审计实验能够在被审计者不知情的情况下获取其自然且真实的行为,从而具备提高研究结果外部有效性的独特优势。目前,审计实验已成为研究歧视的主流方法。 根据实验所采取的审计形式,现有文献常将现有审计实验研究分为采用真人进行审计的现场审计(in-person audit)和基于通信媒介如邮寄信件、电子邮件、电话、传真等进行审计实验的通信审计(correspondence study)两种类型(Gaddis,2018),但并未对近年来依托互联网技术开展的在线审计实验及其应用研究进行明确界定和讨论。本文根据实验所采取的审计渠道是否依托互联网技术,将审计实验划分为传统审计实验和在线审计实验。具体而言,传统审计实验是通过让训练有素的真人扮演求职者、消费者和患者等角色进行当面应聘、消费、就诊或投递除干预条件外其余信息等价的书面信件的方式,引出被审计者对种族、民族和性别等特征不同个体的行为反应,进而对不同干预条件下的结果进行观察比较以识别歧视的研究方法(Lahey和Beasley,2009)。在线审计实验则是由传统审计实验为适应现代互联网环境发展而来,属于在线实地实验(online field experiment),是结合了审计和在线实地实验特征的一种方法,既具有在线实地实验干预随机性强、成本低、数据准确性高等优势(翁茜和李栋,2020),也在审计渠道、审计材料制作等方面与传统审计实验存在显著区别。传统审计实验以现场审计和基于书面信件邮寄的通信审计为主;在线审计实验则作为通信审计实验的新形态,以基于电子邮件、互联网在线平台或在线社区等渠道开展的线上审计为主。 二、传统审计实验发展 早期的审计实验以传统审计实验为主,实证上可追溯至20世纪60年代。为避免基于调查和访谈法所获取的观测数据因内生性而难以准确反映社会中真实的歧视程度,Daniel(1968)在英国种族关系委员会和英联邦移民委员会的委托下,首次采用大规模审计实验方法检验了在英国就业和住房市场中人们对黑人和移民群体的歧视程度,该研究直接促使英国在同年修订的《种族关系法》中明确规定了禁止在就业和住房市场中的种族歧视行为。随后,美国住房政府部门采取同样的方法发现了美国住房市场上人们对非黑人少数族裔(墨西哥裔)的种族歧视问题(Hakken,1979)。这些由住房政府部门主导的审计实验吸引了大批学者的兴趣,他们将审计实验这种方法推行应用至其他各类市场,比如劳动力市场、出租车市场和专家服务市场等。在研究主题上,审计实验研究也不再局限于种族歧视,还关注了性别、年龄和性取向等各类歧视问题以及委托—代理问题,并且在审计渠道上做出改进,由直接采用面对面的审计转向通过书信邮寄开展审计,在保留审计实验随机控制优势的同时,降低了实验员审计时间的投入和来自审计员的偏差。