随着社会逐步迈入大数据和智能化时代,审计人员应该重视计算机审计技术的发展,并运用大数据技术、机器学习等新兴方法查找审计线索,以计算机代替人工,去发现更为复杂的函数关系,学习数据分布,挖掘传统审计手段难以发现的审计疑点。尤其在大气污染防治领域,迫于环保压力,部分地区存在大气污染监测数据造假的情况,如2016年西安监测站空气采样器“戴口罩”现象,2017年宁夏监测站点周边被人为喷水雾等操作时有发生。北京地区的大气污染形势一直以来都受到人们的极大关注,2010~2020年出现了800多次重度污染,且持续时间长。同时,污染物来源的增加,使大气污染的监控和预防更加困难,因此需要新的大气污染监测技术,来满足环境监测与大气污染防治和预警的要求。我国的大气污染防治缺乏系统性技术和实践方案,在目前的审计工作中,很多审计人员还是采用SQL数据库导入数据进行数据查询和分析、利用Excel等电子表格软件进行数据处理和分析,在处理百万级审计数据时,无法通过简单查询语句、分类汇总、数据透视表等功能发现舞弊问题。此外,受限于计算机审计技术的发展,处理大量数据给审计人员造成很大困难,加之大气污染防治审计涉及主体较多(包括政府部门、相关企业、财政部门等),需要多个单位的协作,导致我国大气污染监测信息难以充分披露,透明度不高,信息质量难以保证。 针对以上问题和挑战,在大气污染防治审计中,运用大数据方法分析污染物成分,采用人工智能技术进行预测分析,有助于对大气污染实现防控和治理,能显著提升大气污染监测数据的透明度,减少政府在大气污染防治方面的经济损失,促进京津冀区域乃至全国其他地区的生态文明建设。 本文的创新之处主要有以下两点:一是将计算机信息技术与大气污染防治审计理论方法相结合,利用数字化技术与人工智能技术赋能审计过程,探索环境审计中异常数据的智能分析与挖掘方法,对于提升审计工作的效率和质量,丰富和促进“计算审计学”的理论发展具有重要的学术价值,同时该研究也将丰富人工智能技术的应用场景,对人工智能理论的应用具有重要的学术价值。二是研究成果将大大降低环境审计人员的劳动强度,便于开展全覆盖、全流程的环境审计,对于提升审计工作效率和质量具有重要作用,同时,可减少审计单位的经费投入,产生良好的经济效益和社会效益,且研究成果可供其他审计领域借鉴,具有重要的应用价值。 二、文献回顾 环境审计研究领域普遍认为,政府环境审计产生于受托环境责任理论,受托责任是指环保部门和审计机关的受托责任。自然资源是公众公有财产,企业、个人和社会发展在追求经济利益及社会效益时,对自然资源造成浪费和破坏,最终给人民生活带来负面影响,这种环境成本最终由公众来承担。为保证政府受托环境责任全面履行,公众有权委托审计机关对政府管理成果进行评价和考量,审查政府受托责任履行情况,以改善政府管理制度,促进政府部门高效工作并更好地履行环境保护责任。史晓燕和班景刚、卞兴忠等总结了环境审计的定义和内容,提出了健全的环境审计理论体系并进行了实证研究。曹键和李晓琴对企业环境管理进行绩效评价并将环境绩效审计作为环境管理的工具。周畅分析了政府环境履责审计的定义、内容和作用机制,研究了政府环境履责绩效审计。赵慧琪和李宏欣回顾了大气环境审计现状,通过对现存问题进行分析,对丰富审计内容、创新大气环境审计技术方法做出了贡献。刘桂春和王碧玉通过对北京地区大气污染防治情况的分析,提出了区域性环境绩效审计,建立了区域绩效审计评价指标体系,指出可运用环境费用效益分析进行绩效审计。张璐对政府环境绩效审计目标和方法进行了研究,将审计目标分为根本目标、具体目标和最终目标,并指出指标设计是政府环境审计的重要环节。 我国对大气污染防治审计的研究是近几年才开始的。喻亚敏研究了大气污染防治审计的依据,认为目前并未形成统一完整的大气污染环境审计依据。国内现有文献主要是翻译其他国家在大气污染防治审计方面的法律法规和一些经验做法。刘誉泽认为,我国的大气污染环境审计在制度制定方面、审计人员使用审计工具技术方面、政府财政拨款方面都存在很多不足,并借鉴英国和美国的雾霾治理经验,对我国审计部门执行大气污染防治审计工作提出了建设性意见。钟廷勇等指出我国环境审计方面的不足,如缺少完整的大气污染环境审计方面的法律法规,存在对环境专项资金管理使用不当、不及时的情况,同时资金的使用也缺少监督,以至于存在专项资金不能及时分发、被占用贪污的现象。《大气十条》对大气污染治理工作做出指示,即在大气污染防治工作开展过程中,对于政府对大气污染治理的经济性、效率性、效果性是否与预期目标相匹配,投入和产出是否合理,有必要通过绩效审计做出客观评价。 国外学者在较早时期就开展了大气污染防治审计方面的研究。英美等国进入工业化时代较早。在空气污染问题频发之后,英国审计署于20世纪60年代就颁布了相应法案,近几年又颁布了审计相关法律来规范大气污染防治工作。美国审计署也十分重视空气质量状况,十分重视对大气污染防治及相关工作的审计监督,逐渐发展形成了多种模型方法辅助空气质量预测,并发布审计报告。在大气污染监测技术和方法领域,国外运用的模型主要有统计预测模型、模糊时间序列模型、机器学习预测模型和综合评价模型等,但上述方法在我国大气污染防治审计领域的应用却十分少见。因此,借鉴国外机器学习预测模型的应用,本文尝试在大气污染防治审计中基于无监督和监督学习的相关理论,运用DBSCAN聚类算法和长短期记忆网络的方法,对大气污染相关数据的异常情况进行审计。 三、研究设计 2013~2015年北京出现了280次重度污染,且持续时间长、数据量较大,因此本文选择利用2013年12月31日~2015年8月10日北京地区95个监测站点的165140条大气污染物浓度数据,分析北京地区大气污染物的浓度变化,对大气监测数据进行审计。通过对不同监测点多年数据的分析,找出在大气监测数据集中存在的与模型预测值不同的数据,最终统计出异常数据出现次数较多的监测站点,发现审计疑点,从而助力审计人员的进一步调查分析。选择的六个大气污染物度量指标为:
、
、
、CO、
、
的24小时滑动平均值。在大气污染防治审计中,本文采用监督学习和无监督学习的机器学习方法分别进行空气质量数据舞弊的监测。