“十三五”规划建议提出实施国家大数据战略,旨在全面推进我国大数据发展和应用,加快建设数据强国,推动数据资源开放共享,释放技术红利、制度红利和创新红利,促进经济转型升级。 大数据有数据体量巨大、数据类型繁多、价值密度低、处理速度快的显著特征。大数据是多源异构、跨域关联的数据洪流,是IT时代一种新型技术方法能力和社会新现象。大数据贯穿社会生产全过程,具备资源、资产、商品的全属性,颠覆了传统经济学原理。大数据增值价值巨大,商业价值、经济价值和社会价值不可估量,终极价值在于助力社会进步。大数据横空出世,源于个人全球化、记忆数字化、社会网络资本化的全力驱动,是IT业发展演进的历史使然。 随着信息技术的快速发展,大数据时代的到来为电子数据审计提供了机遇和挑战。如何快速、精准、高效地在庞大的数据海洋里找到被审计单位不易被发现的违规点是现代审计人在新常态下必须面对的问题。统计分析方法能够处理大容量、复杂类型的数据,不仅可以帮助审计人员快速摸清数据总体规模,掌握被审计单位业务特征,还能在较短时间内找到异常数据点,帮助审计人员精准定位、快速突破。因此,统计分析方法在大数据环境下的操作规范及实践经验对审计技术方法的改进具有重要指导作用。 二、大数据审计时代的发展趋势 对于社会、组织甚至是个人而言,大数据时代无疑是一次革命,是对传统理念的一次巨大的挑战,更是社会发展的一次重大的转型机遇,一个实现跨越式增长的契机。随着国家审计在我国深化改革进程中所起的作用日益增强,大数据时代已然成为审计所必须面对的时代,大数据审计会进一步成为加快审计事业发展的契机。 (一)经济社会高速发展推动大数据审计发展 随着国家审计在我国改革前进道路上所起的作用日益加强,审计的地位较以前更能体现其在社会改革进程中的重要性,而中国经济的不断发展,所产生的数据量正呈现几何倍数的增长。在审计全覆盖的重要思想指引下,大数据审计已然成为国家审计所要拥抱的新时代。国家审计要拥抱大数据审计时代,就需要进一步推进在大数据时代下的理论创新及实践拓展,让审计方法不仅仅停留于学术讨论,更应用于审计实践。 (二)审计对象类型复杂推动大数据审计发展 随着近年来互联网概念不断渗透,社会实践活动中计算机、服务器、交换机、数据库、光纤网络等现代化信息技术得到了极为广泛的应用,并在不同的领域发挥着重要实践作用。基于节能、环保等理念不断深入人心,资源的高效利用成为企业、政府事业单位等社会主体所考虑的必要条件,国家审计的审计内容、对象、资源、证据线索也随着实物流、资金流向无纸化、数字化及信息流的方向转变,审计范围较之传统账套、传统财务信息及纸质的业务轨迹进一步拓展到电子数据、内部控制系统及信息系统本身,从而确保审计职能的充分发挥。 (三)信息技术不断创新推动大数据审计发展 就目前探讨较多的大数据技术而言,互联网审计、深度发掘、移动互联网审计、云端技术在审计实践中快速发展。在审计实践中,审计内容、技术、方法与审计质量有密不可分的关系。大数据审计时代下,审计技术及方法不可能完全脱离传统审计作业流程,但面对新的审计时代以及不断增大的数据量,现代审计人必须创新审计方法,将现有的审计作业流程进一步升级改造。在与传统审计作业流程对比后,笔者认为最大的不同之处就在于数据处理及分析部分,而数据分析成为审计作业流程的核心。 三、统计分析方法在大数据审计中的核心作用 传统的审计分析过程与大数据审计时代下的分析过程基本类似,都要通过采集数据、导入及预处理数据、统计及分析数据、挖掘数据疑点等步骤来实现。但是随着数据量呈现几何倍数的增加,加之采集到的数据类型不一,审计人员需进一步转化为结构化数据才能高效分析,因此大数据时代下数据处理方式与传统审计又有不同,而作为审计作业核心部分的统计分析数据则更加重要。 (一)采集数据、导入及预处理数据 大数据审计并不是对传统审计作业流程的颠覆,而是进一步改造。传统审计作业流程中一般采用SQL及Oracle数据库软件将采集到的业务、财务及日志数据储存。由于审计部门一般选取特定的过去时间段作为审计时间区间,不需要过多考虑实时数据的不断增加所带来的采集困难,因此采集数据方面一般采取备份数据及还原数据的方式完成数据采集工作。而导入及预处理数据与传统方法相差较小,均是以转换成结构化数据为主要目的,实现数据分析的快速、准确。在收集和整理数据时应特别关注数据分析方法与数据来源、统计分析与数据收集的一致性问题。在整理数据时,尽量使用在录入和分析数据方面都具有完备功能的统计专业软件。 (二)统计分析方法分析数据、挖掘审计疑点 统计分析方法区别于传统意义的数据关联分析等,能够快速呈现海量数据中存在的离散点,从而找出不合理情况,精准定位问题数据,快速突破。 统计分析方法的核心思想是统计学理念,不仅运用统计学基本知识,还要使用数理统计思想及技术来帮助审计人员解决被审计单位数据分析问题。统计分析的步骤一般包括:一是使用已经结构化的审计数据,运用描述性统计、回归分析等统计方法,分析在时间或空间维度下数据的宏观趋势、分布、离散度等方面,从而帮助审计人员快速掌握被审计单位概貌及历年来发展变化;二是使用多元回归分析法,找出数据间的相互影响参数,总结分析关联规则,发现异常数据,锁定审计疑点;三是重点关注数据中的离散点,对离散点较为明显的数据计算偏差率,并作为审计及延伸重点进行分析。