一、人工智能技术在审计工作中的应用现状 人工智能概念最早由计算机专家约翰·麦卡锡于1956年在美国达特茅斯大学举办的会议上提出,现已发展成为计算机科学的一个独立分支。人工智能技术试图生产出一种新的能以接近人类的思维和处理方式完成相应工作的智能机器。人工智能技术经过60多年的发展,研究和应用范围不断扩大,涉及机器人技术、语音识别、图像处理、自然语言处理、专家系统等诸多技术领域。尤其是深度学习出现以后,与互联网、大数据、区块链、云计算等现代技术相结合,利用大量的数据训练智能模型应用于社会的方方面面,对政务、金融、教育、医疗、商业、制造业等行业都带来了深刻变革。 人工智能的发展在审计工作中的应用及影响也已经成为审计界热议的焦点,一些大型事务所开始尝试将人工智能技术引入财务和审计工作流程中,如德勤推出了财务机器人“小勤人”等,其工作原理就是通过对审计流程环节的人工智能技术优化,将审计师从证据自动化、持续采集,审计底稿初步填写,审计项目管理,文档初步审阅等重复性工作中解脱出来,大大提高了审计工作的效率。但是,现阶段人工智能技术在审计工作中的应用还很初步,涉及领域还不够全面,特别是在审计计划拟制、审计力量安排、审计证据真实性验证、审计问题挖掘和审计问题审核等需要对海量异构数据进行综合加工处理的工作方面,相关进展还乏善可陈。 二、全流程智能审计引擎的总体框架和内容 一般性审计管理流程如图1所示。全流程智能审计是以人工智能技术为基础,通过细粒度拆解分析审计工作流程,建立全流程贯通的数据治理标准,将人工智能技术贯穿应用于全流程审计工作环节,进而大幅度提升审计自动化、信息化和智能化程度。概括来说,全流程智能审计引擎的基础架构示例如图2所示。 全流程智能审计引擎面向审计活动全流程,结合各阶段审计活动特点,融入自动化、智能化技术特征,通过智能技术赋能,降低手工操作复杂度,提升作业精度和效率,从实施阶段来看,主要包括以下8个功能组件:
(一)基于整数规划的审计计划编制和审计力量分配组件。该功能组件属于审计计划阶段。审计计划编制和审计力量安排是审计管理的重要环节,如何科学合理地安排审计计划和审计力量是摆在审计机关面前的重要问题。该组件基于整数规划算法,通过定义目标函数和约束条件将审计计划和审计力量安排量化为求解最优解的问题,即在审计资源有限的条件下,如何合理分配审计力量和审计对象,满足最大化审计目标和最小化的审计风险。按照整数规划得出的审计计划,可根据年度审计特殊要求,增加约束条件或者调整审计目标权重,通过科学规划,避免同一单位被不合理重复审计、重点单位难以纳入审计范围、审计动用力量过大或者偏低的问题等。 (二)基于文本相似度的文件甄别组件。该功能组件属于审计实施阶段。在进行审计调查分析时,如何发现类同合同、如何发现围标串标、如何发现一稿多用,是困扰审计人员的常见问题。传统的人工手动作业方式显然已经无法满足海量审计资料快速检索的需求,而构建索引库虽然也能够提高审计资料的检索效率,但是,它依赖于人工设计的特征词表,只能找出包含相同关键词的文本资料,却无法根据其语义的相似度进行筛选。基于文本相似度的文件甄别组件所采用的文本相似度分析技术是自然语言处理领域中的一项关键技术,主要用于解决两个文本,如句子或者短语之间相似度的度量问题。利用这项技术,可以根据已知文档在海量文本库中发现与之相似的文本文件,并根据分析目标来设定阈值,进而判断问题性质。该组件的实践应用将极大地缩小审计人员的分析时间,提高其工作效率。 (三)基于命名实体识别的数据治理组件。该功能组件属于审计实施阶段。当前经济与财务活动数据包含了大量的文本资料,如各种项目信息、会议记录、采购合同、租赁协议、财务报表等,通过对这些资料的分析可以提取大量的审计工作要素,如人员、时间、事件、金额等,它们对于审计工作具有重要的指标意义。该组件所采用的命名实体识别(Named Entity Recognition,NER)技术,支持从自然语言的语句中分离出具有特定意义的实体概念,主要包括人名、地名、机构名以及审计关注的特定专有名词等。利用该技术,我们可以在处理审计文本资料的过程中自动化地、快速准确地抽取各种审计工作要素,然后将它们分类存储到数据采集系统中,构建针对各类审计文本资料的索引库,方便审计人员检索和统计,方便进行大规模非结构化数据的数据治理。 (四)基于OCR的票据验证组件。该功能组件属于审计实施阶段。经济与财务工作存留了大量的原始票据,除了原物之外,这些票据往往也会被扫描成图片进行存储管理。这些票据图像包含了大量的审计工作要素,如电子发票就有发票代码、发票号码、开票日期、机器编号、销售方名称、购买方名称、购买方纳税人识别号、商品名称、项目、单价、数量、金额、税额、合计金额等。但是由于它们都分散在不同的图片上,不利于审计人员发现其中的关联性。该组件所采用的光学字符识别(Optical Character Recognition,OCR)技术,可以实现对票据图片中的审计工作要素的自动识别和抽取,然后统一保存到数据库中,方便审计人员的快速检索和统计分析。