近年来,经济高速发展引发的环境质量问题引起了各界的广泛关注。在大力推进生态环境监测体系和监测能力现代化背景下,我国环境空气质量监测体系不断发展和完善,基本实现了对环境空气污染物的逐时自动监测。环境空气质量自动监测点位的自动化、精细化,对自动监测信息系统的完整性、有效性、一致性、可比性等提出了更高的要求。因此,开展环境空气质量自动监测信息系统审计势在必行。 大数据可视化分析技术是目前大数据审计应用比较成熟和主流的技术,它拓宽了传统的数据图表分析,把复杂或抽象的信息以直观形象的方式呈现出来,有助于审计人员快捷高效地处理和分析数据。R语言作为一款免费、开源以及具有强大的数据可视化功能的工具,受到国内外高校、研究机构,以及金融、医学、通信等行业的广泛应用。本文以R语言为工具,根据环境空气质量自动监测信息系统风险审计的需要,选择了动态时间序列图、日历图、热力趋势图等可视化图形,研究如何有效利用大数据可视化分析技术审计环境空气质量自动监测信息系统、有效发现潜在的信息系统风险、提高审计效率效果,在理论经验与技术方法上具有一定的意义。 二、环境空气质量自动监测信息系统审计原理分析 环境空气质量自动监测信息系统采用自动控制技术、分析技术、通信和计算机软件技术,可对环境空气中特定指标从样品采集与处理、分析到数据传输全过程实现自动处理。系统主要由监测设备、数据采集传输及查询发布系统组成。国控站点产生的监测数据经过系统软件直接传输至监测总站。省控、市控监测站点由各级行政主管部门负责管理。 基于大数据可视化分析技术的环境空气质量自动监测信息系统审计的原理可概述为:根据对被审计单位的调查,在访谈和现场观察等基础上,采集被审计单位的环境空气质量自动监测信息系统相关信息,如运维机构的日常巡检记录和绩效考核报告、自动监测站点档案、空气质量日均值监测数据和小时监测数据等结构化和非结构化数据,以及从外部相关监管部门网站或其他网站上公开数据源采集来的数据,如监管部门出具的相关通报、处理处罚通知等。然后,在审计大数据预处理的基础上,基于“总体分析、发现疑点、分散核查、系统研究”的审计思路,利用大数据可视化分析技术,从数据连续性、完整性、可比性、一致性、相关性等多个角度,快速从被审计大数据中发现异常信息,检测是否存在信息系统风险情况,获得审计线索。在此基础上,通过对这些结果数据做进一步的延伸审计和审计事实确认,最终获得审计证据。 三、环境空气质量自动监测信息系统审计内容分析 审计人员在开展环境空气质量自动监测信息系统风险审计过程中,可按照国家环境部及各级地方政府对环境自动监测管理的监管要求,关注以下内容: (一)检查自动监测信息系统的监测连续性 根据空气质量自动监测系统日常运行维护的基本要求及有关规定,环境空气自动监测系统应连续运行。
首先在R语言中查看数据结构,如图1所示,发现站点5在2017年的全年日数据仅为337条,数据量存在明显缺失。在宏观把握的基础上,审计人员可采用动态时间序列图查看站点5全年数据的具体分布情况。如图2所示,动态时间序列图的横轴表示日期,纵轴表示污染物监测浓度,用不同颜色的折线代表不同污染物的日浓度,拖动横轴下方的按钮可以缩小时间间隔,鼠标停留的位置会出现日期及各污染物浓度数据的悬浮标签。通过对动态时间序列图时间间隔的拖动,发现站点5缺失了2017/1/16→2017/2/12的监测记录,缺失日期长达26天,不符合监测设备连续运行的规定。审计人员可以通过这一分析,重点核实站点5在监测期间记录缺失的原因、是否在主管部门备案,通过查看站点故障检修记录或者监控视频记录,获取审计证据。 (二)检查自动监测信息系统的监测完整性 审计人员首先整体分析2017年6个国控站点各监测物全年数据的完整性情况,通过图3发现:监测站点对于臭氧(
)的监测效果最好,不存在数据缺失的情况;对于一氧化氮(NO)的监测,各站点均存在较多缺失。审计人员应调查这些监测站点缺失较多一氧化氮(NO)数据的原因,考虑是否存在监测站点设备故障或监测不灵敏的风险。且观察图3可以发现,在个别日期存在监测站点只能监测到臭氧浓度而其他污染物数据均缺失的情况,审计人员应重点关注这些日期,查看是否存在监测设备受到人为删除数据记录或数据传输故障的风险。采用上文提到的动态时间序列图可以确定审计线索出现的时间,通过拖动时间序列图缩小时间间隔,如图4所示,发现2017年9月7日存在只监测到臭氧数据而其他数据缺失的情况,审计人员可以将审计的范围精确到该日期,缩小审计区间,提高审计效率。