在2016年全国审计工作会议上,时任国家审计署审计长刘家义强调:“要运用大数据,创新审计技术方法。推进以大数据为核心的审计信息化建设是应对未来挑战的重要法宝,也是实现审计全覆盖的必由之路”。本文分析了以Oracle为核心搭建的大数据平台在数据分析和挖掘中的优势,探索开展预决算审计全覆盖工作的新思路与新方法。 一、利用大数据平台推进预决算审计全覆盖的优势 (一)大数据平台能够有效满足预决算审计全覆盖要求 大数据平台依托其快速强大的数据处理能力,具备较强的数据采集、整理、转换和程序化、模块化的比对、分析功能。按照财政部公布的中央财政预算,2015年国防预算支出为8868亿元,2016年国防预算支出为9543亿元,2017年已经突破1万亿。面对如此庞大的经费和资金流,以军队审计机构现有人力资源,按照传统审计方式很难实现全领域、全覆盖、全过程监督的审计目标。但是,通过专业技术分析方法实现审计思路、审计目标向计算机语言的转换,借助大数据平台独特的数据处理能力,对数据进行收集、清洗和分析、挖掘处理,使审计人员既能够从宏观层面准确把握整体情况,又能够从微观上精确定位到某个预算单位某笔经济业务等预算构成分子,将审计人员从繁重的碎粒化基础数据查阅工作中解放出来,把审计重心转向以问题为导向的趋势判断、对比分析、问题发掘,不断提升预决算审计的质量和效益。 (二)大数据平台能够有效满足预决算审计质量和时效性要求 预决算审计对质量和时效性要求较高,如果年度预算不能在上半年审结,其效益就会大打折扣;如果不能对不合理、不合法、不合规的预算安排及时提出调整或整改意见,预算审计就会流于形式失去意义。利用大数据平台构建的审计软件系统提供的操作权限控制功能,可以在各审计环节设置控制点实行实时监控,有利于审计工作跟踪检查的进行,使得审计工作的可控性更加及时有效。大数据平台精确、快速的特点便于审计人员快速收集各种审计工作所需的电子数据,高效、准确地统计和分析各种审计信息;同时,审计软件对审计数据的自动汇总、自动计算和及时更新的功能,使得审计这项原本很繁琐很细致的工作,可以通过数据库迅速准确地完成,从而大大提高审计效率,减轻审计工作人员的劳动强度,也减低审计工作的差错率。 (三)大数据平台能够提供联通、开放、共享的信息资源 预决算审计涉及到全军所有预算单位,以大数据平台为核心的预决算审计,为审计等监督机构以及被审计单位搭建起一个重要的信息沟通和操作平台;可以促进审计信息化制度标准规范体系的建立,促进机构间信息资源的共建共享、协同作业、形成合力;可以促进审计信息化骨干人才不断成长,审计信息化队伍持续壮大。 二、搭建大数据平台的技术路线选择 目前常用的服务器系统平台主要有Windows和Linux两大类,其中Windows大家都比较熟悉,它的服务器操作系统与我们常用的桌面操作系统在操作使用上基本类似,如最新的Windows Server 2016其整体的设计风格与功能与Windows 10更加靠近。Linux是开源的Unix系统,它继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统,目前使用极为广范,可以说是无所不在,例如Android手机其底层就是Linux系统。 数据库平台较多,今天许多大型互联网项目都会选用SQL(如Oracle、MS-SQL,MySQL等)关系型数据库+NoSQL(如MongoDB、Redis、HBase等)非关系型数据库的组合方案,如FACEBOOK、淘宝等。关系型数据库适用存储结构化数据,如预算单位信息、预决算信息、会计核算信息等,这些数据通常需要做较复杂的结构化查询,比如jion、group等,这时关系型数据库要胜出一筹,而且这些预决算数据及会计核算数据的规模、增长的速度都是可以预期的,非常适合SQL查询。NoSQL适合存储非结构化数据,如预算编制要求、预决算文档、事业规划和工作计划、项目论证报告、预算执行报告等,这些数据通常用于模糊处理,如全文检索、机器学习等,这些数据是海量的、增长极快,NoSQL具有的近似无限伸缩性特性可以很好满足此类数据管理需要。 作为预决算数据审计平台,建议操作系统平台采用Windows Server,主要是考虑其易用性,对系统管理人员要求不如Linux高;因为仅仅是一个预决算审计事项,数据库平台建议采用Oracle,主要基于以下考虑:一是技术层面,预决算审计数据库平台是一种联机分析处理OLAP(On-Line Analytical Processing)系统,强调的是数据的结构化整理分析,而不是会计核算类的日常交易事务处理的联机事务处理OLTP(on-line transaction processing)系统,它主要是通过查询大量关系数据库的成千上百万的数据记录,为审计人员作决策分析。Oracle作为大型高可靠数据库系统,在安全稳定性方面都有较好表现,而且Oracle在数据分析上提供了较多好用的技术实现特性,如其提供的排名、相邻、统计三类分析函数,应用场景丰富、功能十分强大。二是数据层面,审计对象需要报送的资料主要是财务信息,都是标准化程序较高的关系型数据,每个审计对象每年上报审计的财务数据量基本不超过2M,一个中心每年采集的数据不超过2G,全军每年不超过1TB,每次审计至少需要分析2个年度即当前年度预算数据和上年度的预算数据、会计数据以及银行电子数据,作趋势分析可延长至3个年度至5个年度,这种体量的数据应用首选应该说是Oracle,当然MS-SQL,MySQL也能处理,但在可靠性、数据一致性、查询效率、数据分析性能等方面均略逊一筹。