目前,伴随着云计算技术的发展,大数据正在对全球经济和社会生活产生巨大的影响。自从李克强总理在2015年提出了“互联网+”的战略发展目标以及《国务院关于印发促进大数据发展行动纲要的通知》正式发布后,云计算和大数据给现代审计提供了新的方法。传统的手工审计和单机审计已不能完全适应现代的数据审计工作,联网审计将成为今后审计工作的主要模式,云计算平台与大数据中心将成为应用这一模式的主要依托。同时,这也对审计组织和审计人员提出了更高的要求,他们不仅需要把握云计算技术和大数据的内容与特征,还需要掌握最新的审计技术和方法,提高审计数据分析能力,积极应对云计算与大数据时代带来的深刻变革。 一、传统审计模式遇到瓶颈 目前,我国大部分城市的审计数据都以电子数据的方式保存,这就有利于我们利用计算机完成审计工作。如何在现有条件下最大化地从审计数据中挖掘出有价值的信息,是每一位审计工作者都要思考的问题。从IT时代进入DT时代,各种规则、算法及应用不断深入到各行各业,所处理的数据规模也日益快速增长。传统的数据挖掘模式大多是以单节点的机器为平台,所处理的数据对象也主要是小到中等规模的,当面对海量、多维、分散的数据集合时,传统的数据挖掘模式往往显得力不从心。 本文将海量审计数据与目前国内外研究较成熟的Hadoop系统相结合,该系统具有大数据分布式处理能力和海量数据存储能力,为解决当前海量审计数据挖掘问题提供了一种全新、有效的方案。 二、云计算和大数据引发审计变革 2014年,国务院出台了《关于加强审计工作的意见》(以下简称《意见》),审计“全覆盖”被首次写入审计法规条文。《意见》指出,要加大审计力度,创新审计方式,加快推进审计信息化,提高运用信息化技术查核问题、评价判断、宏观分析的能力,探索运用大数据分析技术,加大数据综合利用力度,提升审计工作能力、质量和效率。实行审计“全覆盖”模式将使多元异构、跨领域的大数据作为今后审计人员面对的主要数据集合,且将原先受局限的被审计单位的内部数据信息扩展到与其相关的所有外部数据信息,如来自电信运营商、银行、互联网运营商、交通枢纽等机构的数据。显然,传统的审计数据分析方法已经不能满足现代审计的要求,如何更好地从大数据中快捷有效地挖掘出有价值的信息,才是当务之急。 值得注意的是,运用传统的审计工具软件和技术方法对被审计单位进行审查时,所查出的问题大多属于表面上的问题,很难深挖其根源。云计算与大数据不仅改变了传统数据采集、处理和应用的技术与方法,还促进了人们思维方式的转变,这些转变将改变人们理解和研究社会经济现象的技术和方法。从审计线索、审计人员、审计技术、审计内容这四个方面进行分析,我们发现,云审计是通过将所有的电子审计数据联网到云计算数据中心来完成审计任务的。因此,审计人员也必须掌握好云计算和大数据相关应用技术,掌握好云计算环境下获取审计证据的技术手段,以确保审计质量。同时,由于审计结果由协议的第三方交付给审计组织单位,从而保证了审计结果的真实性、公平性和公正性。 三、云计算和大数据体系下审计模式的转变 目前,我国使用最多的是将传统手工审计和单机审计相结合的混合审计模式。该审计模式的优点在于相对较直观,因而更容易被审计人员理解和掌握,使其能够快速运用于实际工作中;缺点在于处理的数据量较小,且以样本为单位进行审计分析,虽然在样本范围内结论较准确,但有些以偏概全,同时审计结果信息较单一,难以给被审计单位提供全面的指导。 邓川和杨文莺(2012)认为,云审计是基于云计算这一互联网超级计算模式,使审计人员协同运用存储在“云”中的各种数据和审计资源,从而更有效率、更科学地进行审计的过程。将云审计模式引入审计部门,使审计人员不仅能对被审计单位的全部数据了如指掌,甚至对整个行业的数据都能全部掌握,审计人员可充分利用云计算数据挖掘工具对所有数据进行全面挖掘,不留盲点和死角,再通过审计分析云将挖掘到的有价值的信息快速、全面地上传到审计部门,这些感性的数据及丰富多维的图表信息可以作为审计人员分析被审计单位或行业是否存在违法违规现象或潜在风险的重要依据。 1.传统桌面管理与云桌面管理比较。国内外许多生产商都在积极研发桌面云的运用,如华为桌面云、联想桌面云等。图1将传统桌面与云桌面作了业务模式处理对比。
传统桌面系统可以直接接入业务系统,获取业务数据,对数据安全及保密性高的审计部门来说,因其数据可以随便拷入或拷出,这就要求审计组织单位要时刻监视审计工作人员的办公电脑,以免发生数据泄漏。采用云桌面管理模式后,员工就不能直接从客户端进入业务系统,而必须通过应用交付平台预设的桌面进入业务系统。在此应用交付平台上,用户只能读取和写入,不能使用外部设备将数据备份出来,从而大大提高了数据安全性及保密性,就算审计人员的办公电脑失窃,也不必再为数据的丢失而担忧了。此外,云计算业务平台使审计单位不用再严密监视审计工作人员的电脑,从而使工作氛围得到了极大的改善。 2.数据采集处理:构建开源的Hadoop数据中心平台。传统的数据中心资源承载有限,且所能处理的数据也多为结构化数据,如MySQL和Oracle等关系型数据库中所存放的数据。而NoSQL技术的出现将来自数字信息、媒体信息、物联网络、移动互联网等机构的数据交织在一起,数据结构类型将不再是单一的结构化数据,而更多的是半结构化数据和非结构化数据,具体如图2所示。