一、引言 数据要素具有通过循环迭代和持续累积,实现边际报酬递增的重要特性(费尔德坎普,2005;龚强等,2022)。作为国家治理体系的核心组成部分,税收大数据已经深度融入税收征管、风险管理、纳税服务等核心领域,有效推动了我国智慧税务新生态的初步形成①。那么,如何从数据要素深度参与税收治理的广泛实践中凝练数据要素与传统要素的差异,并将其与经典理论融合拓展?在提升征管效率的过程中,数据要素的存量和增量有何差别?数据要素质量相较于体量是否具有更为关键性的作用?若征管能力内生于税务部门的累积数据要素,其可得性的差异又是否会引致税负的纵向不公平?上述问题的回答对于构建数据基础制度,创新政府管理和社会治理模式,充分发挥我国海量数据规模和丰富应用场景优势,具有重要的理论和实践意义(孙鲲鹏、杨凡,2024)。 从经典的税收征管理论出发,获得有效信息是提升征管效率的核心(波梅兰兹,2015)。因此,现有研究广泛分析和比较了不同信息来源的效果(毛捷等,2022;田彬彬等,2021,2022)。近期研究也普遍发现数据要素对企业绩效、政府治理效能以及经济增长具有积极作用(贝格瑙等,2018;李科杨等,2024)。然而,数据要素的获得能否简单等同于有效信息提升?根据相关的理论和质性研究,数据要素伴随经济生产活动持续产生和积累(费尔德坎普,2005),其边际报酬随着经验累积递增,展现出“干中学”的经济效应(徐翔、赵墨非,2020)。那么,上述特性在税收治理的过程中是否有所体现?又将如何改变未来全面推进“以数治税”的实践路径?这是本文试图回答的问题。 结合上述数据要素特性,本文首先拓展了经典A-S模型(阿林汉姆、桑德莫,1972)。根据住房批量评税系统(以下简称“计税系统”)的决策实践,邻近(同一计税分区内)住房的历史交易数据是确认计税依据的重要参考②:税务部门将估价对象与在估价时点近期交易的类似住房进行比较,求取估价对象的客观合理价格。因此,理论模型将税务部门的征管能力(即发现逃税的概率)内生化为其累积数据要素的函数。在此基础上,模型揭示了数据要素发挥边际报酬递增特性的可能路径:当外部冲击(如本文研究的税收优惠政策)带来数据要素增量时,征管部门得以掌握更多、更新的可比交易案例,将丰富评估模型所需的数据基础,带来征管效率的即时改善;这些新增数据要素还能通过计税系统迭代循环,驱动征管效率持续上升。 在理论模型的基础上,经验证据基于案例城市③住房交易及税收征管等数据展开。启动上述正向逻辑的前提是存在数据要素增量。为此,实证分析采用住房税收优惠政策作为外生冲击,并提供了政策实施后征管部门累积数据要素明显增加的特征事实。在此基础上,利用历史交易数据构造了双重差分模型,研究发现:伴随征管部门累积数据要素增加,采用计税价与成交价比值度量的征管效率提高了6.63%。本文通过验证识别策略的关键假设,以及排除成交价上涨和纳税成本竞争性假说,肯定了数据要素驱动征管效率上升的基本逻辑。机制分析考虑了数据要素存量和数据要素增量对征管效率的影响,结果发现政策效应在增量(新增交易)较多的计税分区中更为明显,并呈现出随时间动态递增的效果。而在存量(历史交易)较高的分区,并未观察到征管效率的显著变化。上述发现印证了数据要素的边际报酬递增特性,说明在征管实践中数据要素的持续更新在驱动征管效率持续提升中发挥了关键作用。 本文进一步讨论了数据要素质量的影响。结合征管部门的评税实践,分别构建内部和外部数据质量的代理指标。一是内部基础数据质量,以各计税分区内“同面积”的住房交易数量作为代理指标。这是从市场法的基本原理出发,特征相似的住房更具有可比性,因此代表了更高质量的评估数据基础④。结果发现,在内部数据质量更高(可比性案例更多)的分区,政策引致的数据要素增量对征管效率的提升效应更为明显。二是外部参照数据质量,采用各计税分区内通过中介平台等第三方渠道成交的住房交易占比作为代理指标。其逻辑在于,若税务部门存在第三方的数据采集工作,在占比更高的分区内利用外部数据交叉稽核的可能性更高,理论上得出的计税依据更为准确。然而,实证结果显示外部数据质量的差异并未带来征管效率提升幅度的显著不同。上述实证发现一方面凸显了内部数据质量的基础核心地位(谢波峰,2015),另一方面也揭示出对外部第三方数据的系统性采集和有效利用尚有较大提升空间。 依循征管能力内生于数据要素的核心逻辑,并考虑到高价值住房通常交易频次较低,即数据要素相对稀疏的现实,本文探讨了征管效率在住房财富水平上可能存在的纵向不公。实证回归结果显示,数据要素对于征管效率的正向促进作用主要集中在价值相对较低的前两组(财富水平在前40%)住房中,对高价值住房征管效率的提升效应则不明显。上述结果与国内外学者观察到的实际税负随收入水平(皮凯蒂、赛斯,2003)或住房财富(解垩,2018)呈现累退的规律相一致。这一结果提示我们,在全面推进税收征管数字化升级的过程中,需高度重视因数据要素可得性差异(特别是高净值、高价值资产的数据获取)带来的“数字鸿沟”与税负公平问题。