在大数据时代,审计人员面临的是海量结构化数据、半结构化数据和非结构化数据,低速度、低效率和高错误率的传统审计模式已经不能满足大数据环境下的审计工作,王海洪等人(2020)认为审计思维需要从传统的审计思维向持续审计思维、全量信息思维、以人为本思维和智能审计思维转变,以大数据技术为核心开展审计工作成了审计发展的新趋势。大数据审计工作需要将数据、分析和审计工作三方面综合起来进行,通过数据采集、数据预处理、数据存储等技术对数据进行加工处理以获得价值密度更高的数据集。徐超和陈勇(2021)认为构建模型有助于提升数据分析的质量与效率,李文君等人(2020)基于天时、地利、人和、综合四个层面构建的企业社会责任风险控制模型提高了企业社会责任内部控制系统的设置合理性和运行有效性,完善了企业应对社会责任风险的能力,降低了履责成本。基于此,在大数据环境下建立“天时—地利—人和—综合”四维审计模型,以SQL语言为核心,结合机器学习、Benford定律、新型绩效指标评价体系,从时间、空间、人员和绩效四个维度对获取的高价值密度数据集进行全方位审计分析,并通过横向和纵向结合对比分析的方式来发现被审计单位存在的疑点数据,进而提升审计工作质量和审计效率。审计与大数据技术的结合具有划时代的意义,对推动国家审计全覆盖,促进国家善治具有不可估量的作用。 二、大数据与审计概述 (一)大数据的特点 随着信息技术的快速发展,大数据技术在各行各业都得到了充分使用。大数据的特点主要体现在四个方面(4V):1.数据量巨大(Volume)。在互联网时代,移动互联网以人为核心网络节点,每个人都是数据的制造者,大量自动或人工产生的数据通过互联网聚集到特定地点形成了大数据之海。在海量的大数据面前,TB、PB数量级已经不能满足各个领域数据的计量,需要使用EB和ZB两个超大数量级对其进行衡量。2.高效及时有效分析(Velocity)。大数据主要通过批处理和流处理两种范式来对实时获得的数据进行高速有效的处理和分析。在大数据环境下,数据的产生、获得和处理的速度极快,对于数据的处理往往都会结合物联网,通过云计算、边缘计算、机器学习等信息技术进行协同处理,因此大数据的处理效率又被称之为“1秒定律”。3.种类和来源的多样化(Variety)。IT技术的不断发展使各个企业开始进行数字化转型,信息技术不断融入企业,不同企业每时每刻都在产生各种类型的数据,比如文本、音频、图片、视频、模拟信号等类型的数据。同时,数据的来源和格式也变得越来越丰富,不仅产生于组织内部运作的各个环节,也来自于组织外部。4.价值密度低(Value)。在物联网的广泛应用中,信息感知无处不在,产生了庞大的数据量,但并非所有的信息都是有效信息,还存在大量重复无效的信息,使得数据的价值密度比较低。 (二)大数据环境下审计思维的转变 大数据环境暴露了传统审计模式低速度、低效率的缺陷,在理论层面上为了适应大数据环境以及克服传统审计模式中的局限性,传统审计思维需要发生转变,主要体现在四个方面: 1.向全量信息审计思维转变。一方面,秦荣生(2014)和郑志元(2016)等人认为在大数据环境下审计思维应当由样本数据转向全量数据。在过去,由于技术条件受限,审计师只能选择采取抽样审计的方式处理大量数据,但是采取抽样审计的方式始终会存在一定误差,会忽略少数或者个别特殊数据带来的影响。随着时代的进步,诞生的云计算技术、边缘计算技术、机器学习、自然语言等信息技术克服了数据计算、存储、预测技术的难点,使全量信息审计成为现实,因此,大数据审计应当从样本数据审计转向全量数据审计。另一方面,因为样本的整体性、分析的逻辑性与结论的相关性是审计过程中的核心要素,丁淑芹(2015)认为从在宏观层面上来讲,大数据时代下的审计人员应该确立全量信息思维。 2.向持续审计思维转变。持续审计要求对被审计单位进行动态监督,被审计单位每发生一项业务,审计师都需要对其进行实时审计。大数据时代下的数据变化速度快、时效性强,如果审计活动时间跨度大,极易导致审计结果不准确。信息技术的快速发展让持续在线审计成为可能,审计人员通过持续在线审计,可以实时掌握被审计单位不断变化的数据,使得审计证据的关联数据与大数据的瞬时变化保持一致,保证获取数据的实时性和最新性,进而在一定程度上保证审计结论的准确性,提高审计效率和审计质量。 3.向以人为本审计思维转变。以人为本的审计思维要求提高审计人员的大数据思维与能力,彭启发等人(2019)认为会计、审计人员需要树立终身学习的思想,及时适应市场变化,成为多元化人才。在大数据环境下,审计人员面对的是海量低价值密度的信息数据,这些数据难以用传统的Excel或审计软件进行获取与处理,因此需要审计人员具备除会计、审计、税法等专业知识以外的计算机信息系统、数据库、SQL语言等计算机方面的知识,形成复合型的知识架构,从而做到以系统为导向,从信息化角度掌握创新的审计方式,将被审计单位的数据信息导入自身审计监督范围中,借助大数据分析和数据挖掘技术对审计过程中的海量数据进行深度挖掘分析,完成对数据的提纯,以达到缩小数据量的目标,并利用自动化审计程序拓展审计取证范围,提供更高保证程度的审计意见。