国家重大政策措施贯彻落实情况跟踪审计(以下简称“政策跟踪审计”)是党和国家赋予审计机关的新使命,已成为新时代的常态化审计工作和重点任务,在更高层面、更广范围、更深层次服务于党和国家宏观决策,促进经济社会发展。政策跟踪审计直接服务于国家治理,要求审计能够及时有效揭示违法违纪问题,分析各项政策的效果与缺陷,关注政策措施贯彻落实中出现的新情况、新问题,推动实现政策目标。面对政策跟踪审计内容更加广泛、审计对象更加多元,传统审计方法已难以满足新时代政策跟踪审计工作的要求。而先进的大数据技术可以为政策跟踪审计提供新的思路,当下,海量、多源、异构的大数据不仅是众多政策的制定依据,也正成为直观反映政策执行效果的重要形式,大数据技术不仅能够精准刻画政策内容,而且能够对政策当前落实情况与后续执行效果开展评估,还有助于实现审计监督的全面覆盖,利用大数据开展政策跟踪审计已成为新时代审计机关的必然选择。本文探索了基于大数据运用机器学习方法开展政策跟踪审计的应用研究,将大数据技术特征与政策跟踪审计理论内涵相结合,从学理角度分析大数据对政策跟踪审计的重要价值;运用Python构建机器学习模型应用于就业政策跟踪审计,阐述审计实践的核心步骤和对关键问题的思考,探索大数据技术在政策跟踪审计中的实际应用,并结合审计实践给出更好利用大数据开展政策跟踪审计的发展建议,进一步推进大数据审计工作的创新发展。 一、大数据对政策跟踪审计的重要价值 (一)大数据助力政策跟踪审计更好地发挥“经济体检”功能 审计机关作为宏观管理部门,要发挥好“经济体检”功能,不仅要“查病”“治已病”,更要实现“防未病”,推动党中央重大决策部署落实到位,保障经济社会平稳健康运行。从“治已病”的角度来说,政策跟踪审计要重点突出过程监督,能够借助某种“载体”精准衡量与刻化政策执行的过程与结果,且便于审计人员对政策执行情况实时评估十分关键。大数据“产生和处理速度快”的特性能够满足政策跟踪审计对政策执行过程与结果准确刻化且实时更新的要求,审计人员利用大数据开展政策跟踪审计能够及时发现与精准透视政策执行过程中的问题,发挥好“治已病”功能。从“防未病”的角度来说,政策跟踪审计不仅要关注政策当前的执行情况,也要预测、跟踪政策的后期执行情况并提出优化建议,对可能出现的新问题、新风险发挥预警作用。审计人员可以基于大数据运用特征工程,采用机器学习方法开展政策跟踪审计,通过广泛而全面地采集目标数据,构建有效的预测模型,量化政策“期望”与执行效果之间的差距,合理地提出高质量审计建议,防范政策风险,发挥好“防未病”功能。 (二)大数据助力政策跟踪审计提升监督效能 在监督政策落实情况的过程中,国家审计的所有权监督需要对政府部门的行政管理权监督开展再监督,在双重监督的环境下会存在监督效率低下,难以精准监督的问题。利用大数据开展政策跟踪审计则能够较好地解决这个问题。第一,基于大数据的政策跟踪审计,无论是监督过程还是再监督过程,所采用的“原材料”都是相同的,即包含政策制定依据以及政策执行痕迹的大数据,这些数据可以统一采集入库并按照不同的监督目的按需利用,达到一套数据一次清洗多次利用的效果,减少对被审计单位正常工作的影响,提高审计效率。第二,审计再监督在利用前期监督成果时,基于大数据的审计成果具有较高的客观性与直观性,数据的统计特征有助于快速、准确复现前期成果,辅助当前审计决策,实现精准监督。此外,还可以利用如K-Means聚类算法,Neo4j图数据库等技术方法发现监督盲区,进一步提升审计监督效能。 (三)大数据助力政策跟踪审计实现全面覆盖 党中央明确提出审计全覆盖要对有关地区、部门和单位贯彻落实党和国家重大经济政策措施和决策部署情况进行跟踪审计,促进中央政令畅通,推动经济高质量发展。政策跟踪审计涉及多种审计客体且与多种审计类型交叉,审计工作实践中面临着政策跟踪审计全覆盖的高要求与审计人力资源有限之间矛盾,也存在审计客体多样化与审计主体专业领域认知局限性导致难以实现权威高效的矛盾,政策跟踪审计全覆盖需要能够统筹审计能力、专业业务能力的基础模式。大数据则为全覆盖工作提供了良好的“统筹基础”,通过数据的全面采集与更新可以助力实现审计监督的全面覆盖,利用如GIS等专业知识赋能审计数据分析可以助力实现审计监督的权威高效,化矛盾为机遇,解决政策跟踪审计全覆盖的痛点和难点。 二、基于大数据开展政策跟踪审计应用探索 (一)基于审计实际需求,选择Python技术平台 审计机关开展大数据审计要求能够发现数据间的潜在关联关系与隐藏的审计问题,并能够深入地对数据进行挖掘与预测分析,需要能够对容量大、类型多、存取速度快、价值密度低的数据综合分析利用的审计工具。数据容量大,要求数据分析工具能够满足处理海量数据的需求;数据类型多,要求数据分析工具要既能够处理结构化数据又能够处理非结构化数据;数据存储速度快,要求数据处理工具性能高,执行效率高;数据价值密度低,要求审计人员能够在海量数据中挖掘数据的价值,要求审计工具的功能不能是单一性的,而应该是能够支持宏观研究的。本文选择能够满足上述功能要求的Python作为大数据审计技术工具。Python是目前最流行的跨平台计算机开发语言,其不需要指定数据类型的语法规则对非计算机专业人员较为友好,学习门槛较低,拥有大量如Numpy、Pandas、Matplotlib等专业科学计算与可视化拓展程序库,以及如Stata、R科学计算软件包等开源资源,可以在审计数据分析中发挥重要作用,审计人员可以在Python技术平台上统一完成数据抽取、清洗、建模、可视化等审计分析全流程工作。