内部审计在企业中承担着监督管理的重要职责, 其高效开展与企业健康发展紧密相连。随着互联网信息技术的发展和企业数字化转型步伐的加快,内部审计必然要面对更多纷繁复杂的异构多源数据。在此背景下,传统审计模式已无法满足要求。综合运用网络爬虫、可视化分析、循环神经网络、自然语言处理、卷积神经网络图像处理等深度学习技术,构建智慧审计系统,打通管理、资产、业务等不同领域的信息壁垒和数据壁垒,快速、准确地对审计发现问题进行定位和描述,完成审计业务的大部分基础性工作,提升业务流程速度,同时减少审计人员的机械劳动时间,已成大势所趋。 一、文献综述 (一)大数据环境下的智慧审计 大数据、云计算是新时代的一种崭新的计算模式,它集计算机技术与网络技术为一体,运用网络存储、网络计算、负载平衡、分布式处理等技术将大量虚拟化计算机技术运用到计算机系统中,实现计算机资源的远程配置,供远程用户获取信息资源。大数据是传统数据库软件在数据采集、管理和分析能力之外的数据集合,数据量较大,数据流动较快,且包含多种类型数据。云计算与大数据关系密不可分,如图1所示。
随着国家大数据战略的实施,基于大数据的智慧企业快速发展。在大数据环境下,企业的数据管理模式也随之改变。有了云计算的支撑,企业就能从海量动态、多元化数据中快速获取有用信息,从而提高决策能力。大数据具有价值高的特性,海量数据可以通过新型数据处理模式进行高效转换与利用。大数据主要技术涵盖采集、预处理、存储与管理、分析与挖掘、展现与应用五大技术层面。 为适应审计工作新要求,智慧审计的概念被相关学者提出。将大数据运用于审计工作,可以为审计过程提供多样化的数据分析,审计人员可以从复杂数据中获取深层信息,迅速发现异常数据和审计疑点,为审计工作带来不可估量的增值。智慧审计以被审计单位计算机信息系统和底层数据库原始数据为切入点,首先对信息系统进行检查测评,再通过对底层数据的采集、转换、清理、验证,运用查询分析、多维分析、数据挖掘等多种技术方法构建模型并进行数据分析,发现趋势、异常和错误,把握总体、突出重点、精确延伸,从而收集审计证据,实现审计目标。 大数据环境下的智慧审计,关键在于数据获取,数据的质量和数量最为重要。多方数据采集是从数据中挖掘隐藏信息的有效前提,由于大数据技术的进步,大数据的数据来源已经得到一定程度的优化,如何进一步实现跨专业、跨地域、跨类型的全量数据采集、分析与应用,是审计工作的重大创新点。目前,国内对智慧审计的研究还处于起步阶段,大数据在审计中的应用包括审计取证模式研究、全流程风险防范、证据获取和检验等。孙玥璠和宋迪(2015)以政府审计中的高校基建工程结算审计为例,在大数据环境下构建了基于孤立点分析的审计抽样模型。吕劲松和王忠针(2014)对国家审计中的金融审计构建数据分析平台,从整个平台的建设过程、主要功能、主要特点进行了详细说明。张玉岭(2019)基于深度学习构建了智能审计模型,采用自动编码原理提取内部审计非结构化数据的深层特征,并开展审计数据与比较基准数据之间的对比分析。马志娟和梁思源(2018)通过对大数据给政府责任审计监督全覆盖带来的影响及现有的发展困境进行分析,提出了大数据背景下政府环境责任审计的实施路径。基于大数据的智慧审计在财政、金融、电信、保险等具有海量数据的行业展现出极强的生命力和效能,并逐步在财政审计、工程审计、民生专项资金和社保资金审计等方面获得了较高的关注度。 (二)深度学习的演变与发展 随着互联网的发展,大数据、云计算等技术被广泛应用于各个领域,其背后的“大脑”——人工智能技术的普及,引发了一系列颠覆性的科技革命和产业变革,推动了经济和新兴产业的发展。当前,人工智能的作用主要在于信息收集、分析与开展决策。大数据为人工智能的发展带来了难得的契机,人工智能的核心思想是在海量数据的基础上不断更新参数以优化决策,大数据技术能为人工智能开展学习带来丰富的素材。云计算技术是人工智能的另一个重要支撑,云计算相关技术的发展使人工智能成为一个能独立思考的“大脑”。 人工智能的分支学科包括机器学习、深度学习、认知分析和自动机器人程序等。深度学习(Deep Learning)的概念由Hinton等人于2006年提出,其已经成为人工智能的研究热点之一,并在许多应用中取得了巨大成功。深度学习不仅比浅层神经网络拥有更复杂的网络结构,而且在特征学习、模型构建和模型训练等方面也明显优于浅层神经网络。基于深度学习的人工智能技术能够吸收环境中的知识和经验,并从中学习隐藏的信息,从而提高决策能力。经典的深度神经网络包括卷积神经网络(Convolutional Neural Network,简称CNN)、深度置信网络(Deep Belief Betwork,简称DBN)、堆栈自编码器(Stacked AutoEncoder,简称SAE)、循环神经网络(Recurrent Neural Network,简称RNN)等,此外还有深度残差学习、长短期记忆网络(Long Short-Term Memory,简称LSTM)等已经应用在知识发现、模式识别、信息生成、趋势预测、异常探测等领域。这些网络呈现多层级联的结构,可以从复杂的数据中提取有助于判断的特征信息。 目前,国内外学者已经对深度学习及其应用有了相当客观的研究成果。国内方面,赵旻昊(2013)将深度学习算法与数据融合技术相结合,构建了可应用于浮式储油卸油装置(Floating Production Storage and Offloading,简称FPSO)系统的深度学习网络模型,验证了该技术在FPSO预警功能方面具有很高的效率和准确性,可以应用到风险预警领域。江舒宇分阶段讨论了人工智能在审计工作中的应用前景、应用流程等问题,并且指出人工智能在审计中面临的困难。国外方面,Lee和Kwon(2017)采用一种新的CNN网络,它比现有的用于高光谱图像分类的深度网络更深更广,可以通过联合利用相邻单个像素矢量的局部空间光谱关系最佳地探索局部信息。Tang(2018)等人提出了一种数据驱动的故障检测方法,该方法将DBN与多元静态相结合,以应对非线性问题。Park和Yun(2018)提出了一种基于RNN的编码一解码器的快速自适应异常检测模型。综上所述,国内外对于深度学习网络的研究已从多个方向有所发展,深度学习网络的实际应用也取得不错效果。