随着移动互联网、云计算等新兴事物的快速发展,全球数据量爆炸式增长。大数据环境下,传统微观分析的效率大打折扣,因此,应该重视和开展宏观分析。 宏观分析首先分析数据的总体情况,如总数据量、数据涉及到的总金额以及数据所核算的业务范围和针对的客户群体等,从而掌握数据总体特征。其次分析数据的总体结构,如不同地区、不同部门、不同行业、不同客户群体在时间和空间等维度上的数据分布情况等,从而确定数据的重点部分。最后分析数据的总体变化趋势,如数据在不同地区、不同部门、不同行业的增减变化情况,从而初步掌握数据的发展变化方向。 通过宏观分析寻找和发现共性规律,可以对被审计单位或相关行业的数据特点和业务特点有更深入的理解。此外,对宏观分析中发现的异常数据进行深入分析和研究,能够缩小可疑数据范围,快速高效地发现可疑数据中的问题线索,同时结合经济形势等外部环境变化情况,从而合理确定审计疑点,明确审计方向。 相关关系分析 大数据环境下数据分析的另一个明显变化,是从“因果关系”到“相关关系”的逻辑演变。分析因果关系,要基于精确性;但相关关系的核心是量化两个数据值之间的数理关系,这种数理关系是通过对数据间的关联程度分析计算出来的,不需要十分精准。大数据环境下的相关关系分析,基于巨量数据样本进行分析,不再将精力过多关注于对数据的精准计算,而是致力于寻找和发现数据中所隐藏的关联关系。 审计人员可以拓宽视野,关注跨市场或跨企业运行的一些金融产品,利用Apriori或FP-growth等相关分析算法,对产品交易价格和发展趋势进行分析,寻找和发现一些从表面上看没有明显因果关系、但很有规律的同向或反向走势的产品,再对产品交易的真实情况以及背后利益相关方之间隐藏的关系进行深入挖掘,就可能发现人为操纵市场牟利或企业联手违规获利等问题。 预测性分析 预测性分析涵盖各种统计学技术,通过捕捉各个因素之间的联系,对未来或其他不确定事件进行预测,从而指导决策。大数据环境下的预测性分析,通过对数据的量化分析,结合预测模型、机器学习和数据挖掘等技术来分析当前和历史数据,在一定的条件下,对数据的发展变化趋势作出科学判断。 在审计中,可以先对某项业务进行“数据化”处理,将业务的关键环节量化为数据,再综合运用回归预测法等预测性分析方法以及相关关系分析方法,对业务未来的发展趋势作出分析和判断。如果发现实际发展结果与预测不符,可以对相应的事项进行进一步的分析和研究,通过查找和分析差异产生的原因发现问题。 非结构化数据分析 大数据分结构化数据和非结构化数据两大类。结构化数据分析的历史已经很久,但是非结构化数据分析的成熟度还远远不够。随着互联网的发展,非结构化数据占据了数据量的80%,大量语音、文字、图片和视频等信息充斥人们的交流空间,应该高度重视和利用这些看起来不起眼的数据,从中提取出有价值的东西。 在审计中,非结构化数据分析也有用武之地。如在审计招标过程时,根据建筑工程非结构化数据特点,通过文件属性分析、相似度分析、错漏一致分析和价格趋势分析等方法,可能发现不同建筑公司投标书报价相近以及雷同错漏一致等问题,从而为认定串标行为提供有力证据。 数据可视化技术的应用 数据可视化技术,是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,并将数据的属件值以多维数据的形式展示出来,从不同的维度观察数据,从而对数据进行更深入的观察和分析。地理信息系统软件等具备可视化技术的软件日益成熟,为审计人员提供了便利条件。如利用地理信息系统软件的分层展示功能,将由于所在区域不同纳税税率不同的纳税人进行分类,并分层进行展示,直接呈现在审计人员眼前。审计人员不需任何编程和复杂的操作,就能够轻而易举地识别出纳税税率不合规的纳税人;通过软件提供的图元选取功能,将不合规的纳税人选取出来,甚至可以直接形成审计证据。 大数据环境下,审计数据分析有了前所未有的广阔天地,未来在广大审计人员的共同努力下,必定会使审计数据分析发挥更好的作用。