大数据环境下多维数据审计分析思路

作 者:

作者简介:
刘玉冰,南京审计大学研究生院

原文出处:
中国审计报

内容提要:

02


期刊代号:V3
分类名称:审计文摘
复印期号:2017 年 04 期

关 键 词:

字号:

      数据分析是大数据技术的灵魂。早在1993年,联机事务处理难以满足终端用户对于数据库查询分析的需求时,就出现了多维数据分析方法,数据分析人员可以借此对数据进行多角度、多侧面、更深入、更便捷的分析。刘家义审计长在《中国特色社会主义审计理论研究》一书中指出,审计信息化发展环境可以归纳为数据集中化、集中海量化、海量共享化、共享融合化、融合精细化。可见,审计信息化建设是顺应时代潮流,重点探索运用大数据技术更是响应时代的号召。这里从五个方面简要介绍多维数据的审计分析思路:

      上卷单维度分析审计总体数据。上卷(Roll-Up)是指在数据立方体中,对多维数据执行聚集的一种操作,通常通过在维度级别中上升或者消除一个或多个维度来观察更为概括的数据。如沿着时间维度上卷,从“月度”上升到“季度”。

      在实施延伸审计过程中,审计人员所发现的具有较明显特征的问题或线索比较零散,难以满足审计全覆盖要求,难以形成有力的审计证据。利用上卷技巧可以有针对性地集合多维数据集,达到由个体到整体、由点及线、由线及面,反映问题全貌。例如在国税审计中,审计人员对于税款征收、税款减免、税收入库等的分析,可以在税务机构维度上从区县税务局到省级税务局、在时间维度上从月份到年度、在单位性质维度上从个体到行业等,逐步掌握整体情况。

      下钻追根溯源分析审计疑点。下钻(Drill-Down)是指从某个维度更低层次即下降或引入一个或多个维度来更细致观察、分析数据的操作。它是上卷的逆操作,沿着维度级别层次向下。

      下钻是从整体到个体、从一般到特殊、由面到线、由线触点的分析方法,有助于审计人员掌握整体情况后,突出审计重点。上卷是为了全面了解进而从面上分析数据的结构和趋势,信息相对宏观;而下钻则是在掌握总体情况后为分析疑点寻求线索深入分析个案数据,信息相对微观。

      旋转多维度研判审计重点。旋转(Rotate)是指改变数据维度方向,以得到不同视角的数据。

      在审计中,旋转多维度数据分析伴随着审计人员思路变化而生成数据的不同形态,有利于审计人员从多角度审视审计数据,选择科学的审计范围、时间和重点,判断其发展趋势,剥茧抽丝、逐步深入,寻找存在的问题、成因和系统风险。

      以国税审计为例,以某市国税局税收征收明细表为事实表,将征收基数状态、地区、经济类型、时间作为维度。确定重点关注的时间范围后,将时间维度旋转到地区维度,确定重点审计区域;将地区维度旋转到经济类型,确定重点征收对象类型;最后将时间维度与征收基数状态维度交换,分析判断征收趋势。

      切片单维度分析审计重点事项。切片(Slice)是指在数据立方体中,对其一维度进行的选择操作,其结果会得到一个二维的平面数据。

      在审计实践中,可以根据审计视角需要,通过一次或多次切片,分析某一维度的构成和趋势,它不同于上卷、旋转技巧,切片侧重于就审计重点深入研究。

      以保险审计为例,在理赔率分析中,将地区、保险产品类型作为维度。按地区维度切片,选择理赔率突出的分公司作为审计重点;按保险产品类型维度切片,选择理赔率突出的险种,可以核实理赔的真实性。

      切块多维度分析审计重点事项。切块(Dice)是指在给定的两个或多个维度上进行的选择操作,其结果会得到一个子立方体。它是切片的拓展,得到的仍然是一个多维数据集。

      审计人员为突出审计重点,往往需要对一个时间跨度、一个或多个区域范围等数据进行分析,切片难以达到目的,而切块则可以将数据集切割成多个更贴近审计需要的子立方体。以保险审计为例,通过了解整体情况,确定一些审计重点,接下来审计人员需要对某些分公司、某些保险产品种类、某些销售渠道等进行重点分析,可以通过将审计重点数据按不同纬度逐步切块,剔除非关键因素,使得到的子数据集更贴合审计重点。

      总之,在实践中探索“集中分析、发现疑点、分散核查、系统研究”的审计模式,探索运用大数据技术迫在眉睫。熟练掌握多种大数据环境下的数据分析技术,已经成为当今审计人员亟待提高、不可或缺的职业素质。

相关文章: