深度学习模型应用:面向审计业务全流程的整合性框架

作者简介:
吴勇(副教授),陆艺,张超(博士),合肥工业大学管理学院;朱卫东(博士生导师),合肥工业大学经济学院。

原文出处:
财会月刊

内容提要:

02


期刊代号:V3
分类名称:审计文摘
复印期号:2023 年 03 期

关 键 词:

字号:

      科技强审是21世纪以来审计发展最显著的特征之一。大数据时代,传统审计取证模式、审计流程和审计技术方法需要做出适应性变革。深度学习作为人工智能领域的前沿性技术,通过建立分层的人工神经网络(又称为深度神经网络),试图模拟人脑中的生物神经元网络,利用高效的学习模型自动从海量数据中提取数据特征,从而识别潜在的数据模式,洞悉规律,推动做出数据驱动下的管理决策(Ting,2019)。随着互联网、移动通讯、5G技术的兴起以及计算机处理速度和数据存储能力的提升,深度学习已被广泛应用于计算机视觉、语音识别、自然语言处理和其他数据分析等领域。深度学习方法能够将特定过程的结果与相关数据拟合,有效辨识出海量数据背后的模式特征和规律认知,以便发现异常、预测趋势,将对舞弊侦测、审计风险评估以及审计决策判断产生重要影响,这种数据驱动的决策也会引发会计和审计领域的研究范式实现由演绎推理向归纳分析的转变。

      然而,目前深度学习在审计领域的应用仍处于起步阶段,究其原因主要有以下两个方面:一是审计工作的复杂性。高质量的审计决策有赖于审计计划、审计实施和审计报告的有效协同,如果缺乏一个系统性、全局性的框架来系统谋划和协调不同审计阶段的系统设计,新的数据分析技术就很难应用于审计实践并取得成效。二是技术的复杂性。深度学习所建立的深度神经网络是由复杂的算法所驱动,过程的可理解性和结果的可解释性较差。审计师和监管机构难以了解深度神经网络内部的输入是如何相互作用并产生最终的输出结果,深度学习的内部运作对其而言更像是一个“黑箱”,这严重制约了相关主体应用深度学习方法的动机和意愿。

      为此,本文在明晰深度学习相关概念内涵的基础上,剖析深度学习模型的工作原理,针对深度学习是基于数据驱动的特点,以设计、开发和更新审计数据仓库为切入点,面向审计业务全过程将深度学习的机器智能和审计师的知识与经验有效融合,从而构建深度学习模型审计应用的集成性、整合性理论框架,以便更好地指导和推动深度学习模型和方法在审计方面的应用。

      二、文献综述

      深度学习具有强大的多结构类型数据分析处理能力,不仅可以分析传统的结构化财务数据,还可以分析半结构化或非结构化的数据,如社交媒体信息、电子邮件、新闻报道、电话和视频,通过机器自动提取的数据特征作为补充证据,可以丰富审计师对客户业务和行业的理解,帮助审计师更好地评估客户的审计风险,提升审计效率和质量。深度学习算法不再主要依靠重复性抽样技术,而是可以审查公司的整体数据,审计师能够以更加全域和科学的视角来组织实施更有针对性的测试,及时辨识公司各类异常情况和存在的风险。而且,深度学习算法从海量数据以及不同项目中习得的知识和规律,推广应用于具有类似特征的其他项目,有助于提升知识共享应用的效率。审计师可以从更宽广的数据覆盖面、更详细的数据分析和更深入的决策洞察中获益。

      深度学习已广泛应用于审计领域的多项任务中,如审查源文件、分析业务交易和事项、评估风险等。学者们还探讨了利用深度学习来预测欺诈风险、破产风险、重大错报风险、识别异常情况以及公司未来的业绩表现等。深度学习的文本理解、语音识别、视觉识别和结构化数据分析能力,为提升审计证据的信息识别能力和审计决策判断能力提供了重要帮助。一方面,深度学习提升了审计证据的信息识别能力。因为深度学习能够从半结构化数据(如文本数据)或非结构化数据(如图像、音频和视频)中识别、提取有价值、有洞见的信息,极大地拓展了审计证据的信息来源,而且不同来源证据之间的相互佐证也能有效提升审计证据质量。另一方面,深度学习强大的信息识别功能为复杂审计决策提供了数据基础,当数据量大且输入变量众多时,深度学习所具有的高效精准预测性能的优势将进一步突显,能够提供准确度更高的分类和预测结果,从而为复杂审计判断提供有效的决策支持。因此,从算法和技术的视角出发,基于深度学习的方法能够丰富审计证据,改善审计决策机制,有助于提升审计效率和审计质量。

      三、概念界定与关系辨析

      (一)人工智能、机器学习与深度学习

      在探讨深度学习的审计应用之前,有必要明晰人工智能、机器学习和深度学习的概念内涵以及这些概念之间的关系。

      人工智能是研究如何使用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。智能行为包括观察和感知周围环境的能力、从语音或文本中提取信息的能力、从获得的信息中学习以及利用这些信息做出决策的能力等。人工智能作为一种自适应、自学习系统,可以通过计算机程序来模仿人类的判断和认知技能,感知外部的环境变化,能够从数据中自主学习和自我进化,以便做出决策、预测或采取最佳的适应性行动。例如,谷歌地图可以综合考虑事故、施工和天气情况等,给出最优的交通路线选择,从而减少通行时间。人工智能领域的研究主要包括机器学习、自然语言处理、计算机视觉、认知计算等。

      机器学习这一概念于1959年被创造性地提出,其被界定为“一个研究领域,它赋予计算机不需要明确编程就能学习的能力”。Mitchell(2006)则为机器学习提供了一个被广泛参考的定义:“机器学习领域关注的问题是如何构建随着知识和经验的积累而能够自动改进的计算机程序”。两类观点都坚持机器学习的目的是使计算机自动(而不是由人类明确编程)使用算法从历史数据中学习模式和趋势,通过不断迭代改进其学习性能(通常以预测精度来衡量),并应用所学到的数据模式或趋势来进行相应的预测。例如,银行利用机器学习算法来分析大量的历史数据,从而建立信用风险预测模型。人工智能可以被认为是自主机器智能的广泛目标,那么在这一意义上,机器学习是实现人工智能的具体科学方法(Hinton和Salakhutdinov,2006)。

相关文章: