大数据时代军队审计数据分析初探

作者简介:
王燕,78326部队管理处;付小蕊,昆明西坝第干休所;余侃,军事经济学院研究生四队

原文出处:
军队审计

内容提要:


期刊代号:V3
分类名称:审计文摘
复印期号:2014 年 06 期

关 键 词:

字号:

      一、大数据的概念解析

      大数据概念的提出可以追溯到《自然》杂志2008年9月专刊中发表的文章《Big Data:Science in the Patabyte Era》,此后大数据这个概念即被广泛地应用和传播。随着大数据研究的深入,大数据概念的内涵和外延不断地发生变化,业界对其定义尚未完全统一。目前主流的定义基本是从大数据的特征出发,试图通过阐述和归纳这些特征来给出大数据的定义,其中比较有代表性的是4V(Volume、Variety、Velocity、Value)定义。一是数据体量巨大(Volume)。当前,典型个人计算机硬盘的容量为GB量级,而一些大型数据库的数据量已经达到PB量级(1PB=1000000GB)或接近EB量级(1EB=1000PB)。二是数据类型繁多(Variety)。相对于以往便于存储的以文本为主的结构化数据,包括日志、音频、视频、图片、地理位置信息等在内的非结构化数据越来越多,多类型数据对数据的处理能力提出了更高的要求。三是价值密度低(Value)。价值密度的高低与数据总量的大小成反比。如何通过强大的机器算法更迅速地完成数据的价值“提纯”是目前大数据汹涌背景下亟待解决的难题。四是处理速度快(Velocity)。数据流成为高速实时数据流,需要快速、持续的实时处理。大数据强调将数据结合到业务流程和决策过程中,部分类型的数据必须实时分析,才能对业务产生价值。

      二、大数据时代给军队审计数据分析带来的机遇和挑战

      (一)大数据时代给军队审计数据分析带来的机遇

      1.军队审计数据分析的认同感大为增强。军队审计部门作为综合性的经济监督部门,一直秉承用数据说话的传统。审计报告中无论是综合评价,还是揭示问题,无一不是以数据为支撑的。在大数据时代,充分利用数据仓库、联机分析、数据挖掘和数据可视化等技术,把离散存储于不同系统中的海量数据彼此关联并进行深度挖掘分析,可以对经费的使用情况、法规的实施效果进行评估,从而得出客观的审计结论,所有这一切都将会得到各级党委和被审计单位的高度认同,从而进一步提升军队审计自身的地位。

      2.军队审计数据分析所需的基础数据的获取将变得更为便利。在破除了军队内部协同思想理念上的障碍后,随着大数据技术发展,跨越系统、跨越平台、跨越数据结构的技术将使军队内部纵向、横向部门得以流畅协同。军队审计部门不再需要分别点对点地与被审计单位进行联网,只要接入内部网络,所有审计所需的数据在设置一定的权限后都可以直接获取,大大节约了审计成本。同时由于利用大数据技术,数据处理及分析响应时间将大幅减少,审计工作的效率将明显提高,可以同时对多个类别、多种领域的数据进行分析、处理。

      3.军队审计数据分析将更有助于提高预测预警能力以及应急响应能力,更好地服务党委决策。审计数据分析可以通过对相关领域长年累月形成的数据的分析,挖掘出某种群体行为的特点,提示某种违规现象的潜在规律,为党委制定政策提供关键依据,同时还可以评估财经政策的实施效果,从而帮助各级党委不断发现问题、改进政策。

      (二)大数据时代给军队审计数据分析带来的挑战

      采用数据集中存储的信息资源配置模式有利于资源统一规划和使用,为军队建设向信息化转型奠定了坚实的数据基础。但大数据的“四V”特征在数据存储、传输、分析、处理等方面均带来本质变化,数据量的快速增长为归集、整理、存储及综合利用被审计单位电子数据带来了挑战:一是电子数据高度集成,传统的以审计组为单位分散审查的审计模式难以有效发挥作用;二是数据量巨大,广泛存在的数字信息不利于军队审计人员找准审计重点并进行专业判断;三是数据结构复杂,军队审计人员在短时间内难以全面掌握和了解数据内涵及数据表间勾稽关系;四是数据类型多样,军队审计人员对非结构化数据进行综合分析和处理的能力有待提高。

      三、大数据时代军队审计数据分析的策略

      (一)围绕审计工作目标,开展数据基础式审计

      打破传统的以审计组为单位分散审查的审计模式,整合审计资源,在综合分析审计人员的计算机水平、工作经验、专业审计领域等情况的基础上,成立数据集中分析团队。以审计工作目标为导向,以数据为基础,按照“总体分析、重点审计业务分析、重点审计事项分析”逐层深入的思路,以“三个坚持”为原则,即坚持数据分析必须以审计业务需求为核心、坚持数据分析对审计实践的指导、坚持审计实践对数据分析的推动,运用信息系统审计技术方法全面分析被审计单位经费运行中存在的缺陷和不足,明确数据分析的思路和方法,开展数据基础式审计,为审计工作的顺利开展提供技术支持和数据保障。

      (二)分析后台数据结构,锁定重点信息资源

      海量数据的汇集加大了对重点及敏感数据审计的难度,对大数据的无序使用也会耗费大量的审计资源。可以通过查阅被审计单位规章制度,审查单位内部对不同业务数据的使用管理是否到位,是否制定完善的数据库管理和安全操作制度,对重点领域数据库是否制定了严格的日常监管措施,是否制定了移动设备安全使用规程;借助采集的数据库设计文档和数据字典,掌握后台数据结构,明确重点领域数据库的范围;通过采用穿行测试、代码审查、文档查阅等技术方法确定与审计业务紧密相关的核心信息资源,如重点表、重点字段、表间关联及字段含义等,为深入开展数据分析做好准备。

相关文章: