一、智慧审计:概念提出与思维提炼 在国际前沿文献中,学者们深刻阐述了大数据、区块链、人工智能、机器人流程自动化(Robotic Process Automation,RPA)、云计算、物联网、传感与成像技术、定位技术、文本与音频识别等数智时代新技术如何应用于传统审计工作之中,并辩证讨论了其优势与局限,进而从相关技术改进、审计思维调整、审计角色转变、准则修订与制定、针对技术的审计与内控等方面,提出了务实建议。在本文所搜集的文献中,无一篇提出大数据审计、区块链审计、人工智能(智能)审计、云审计、物联网审计、计算机审计、无人机审计等时髦的概念,反而是审计大数据、审计区块链、审计智能合约、审计云等概念经常被提及。 究其原因,可能有以下几点:(1)特定数智技术在审计中的应用并未形成一个全新、独立的审计方法论体系。比如,大数据审计是以大数据为审计证据、以大数据分析为方法贯穿的全新审计模式吗?若是如此,则无法满足现行准则的要求,被审计单位和监管部门均不会允许。因为通过大数据分析获得的基本上都是质疑性、线索性的分析证据,不能作为直接证据。(2)诸如大数据审计、区块链审计、人工智能审计等提法容易产生误导。比如,大数据审计是对大数据进行审计还是利用大数据进行审计或利用大数据辅助审计?若利用大数据进行审计而非辅助审计,则谁能讲清楚审计中需要哪些大数据?(3)这些提法将不同的数智技术割裂开来,背离了各种数智技术共同应用于审计的交互性与集成性,不利于更全面地改进数智时代的审计实务。比如,大数据应用于区块链、区块链也产生大数据,人工智能需要大数据、大数据的生产与分析也用到人工智能(如机器学习),云计算是大数据存储与运算的平台、区块链和人工智能在云计算中也有应用,RPA将用到大数据、区块链和云计算。 鉴于审计工作的系统性与复杂性以及数智技术应用的广泛性与交互性,本文因循国际前沿文献,跳出在审计中得以应用的某一特定数智技术,提出能够概括数智技术应用于审计的本质逻辑与核心思维的新概念——智慧审计。 概括而言,智慧审计是指将数智技术和场景应用于审计工作之中,通过减少人工工作以辅助、改进审计,进而提高审计效率与效果的审计思维总称。该概念透视出了智慧审计的三种核心思维:(1)智慧审计是一种审计思维,而非全新、独立的审计方法论体系。(2)智慧审计是为了辅助审计、改进审计,并不是为了也无能力颠覆审计(至少在短期内是如此)。(3)在智慧审计中,所有可减少人工工作且能提高审计效率与效果的数智技术均可被应用并统一于审计的技术逻辑框架之中。
如图1所示,智慧审计中的各数智技术相互交织并统一于“收集证据、评价证据”这一审计本质之中:一是大数据为审计证据扩充了数据源。所有有助于实现审计目标的数据均为审计师所用,因此大数据将弥补审计师获取非财务、会计数据不足的缺点。其中,数据挖掘、物联网、传感与成像技术、定位技术、文本与语音识别等技术将大大提高数据提取、处理和分析的效率与效果。二是区块链和智能合约将为比对验证证据之间的不一致提供便利。评价基础是规则制定,在区块链和智能合约下可根据既定规则进行自动验证。三是人工智能将为整个审计流程与程序的执行提供自动化支持,从而减少机械性、重复性的人工工作。代表性的人工智能应用如适用于审计具体流程的RPA(如风险评估)、利用无人机执行检查和观察程序、机器学习等。四是云计算将为智慧审计提供平台支持。在智慧审计情境中,证据、程序、技术、方法、互动的背后都是数据(或)及其算法,云计算使得将它们统一在一个集成的平台之中成为可能。五是大数据、区块链、人工智能、云计算等数智技术相互交织,共同服务于审计工作。 二、智慧审计理论前沿:国际文献 根据智慧审计的概念和图1所提出的技术逻辑框架,结合国际前沿文献的理论逻辑与主题分布,本文进一步构建智慧审计运行机制架构图(见图2)。该图的突破在于,将智慧审计置于“业务→数据→会计→审计”的大逻辑链条中。由此可更全面地了解智慧审计的运行机制:既包括数智技术对审计本身的影响,也包括数智技术对会计、业务的影响。其中,前者是直接机制,后者是间接机制,二者相互影响。基于图2,本部分将分别围绕大数据、区块链、人工智能、云计算如何影响、应用于审计会计及业务之中来梳理文献。
(一)大数据:证据来源极大扩充 大数据(BigData)是指传统数据处理方式无法充分处理、量大且复杂的数据。通常,大数据具有以下三个特点:(1)大量(Volume),即海量数据。Mayer-
和Cukier曾提出现代生活“一切皆可数据化”的理念。当今全球的数据量已经从GB级发展到PB级,甚至开始向EB级、ZB级发展。(2)高速(Velocity),即数据获取、处理、分析的速度快。据统计,全球每天能产生12.5万亿字节的数据。(3)多样(Variety),即数据来源和形式的多样性。大数据中既有结构化数据,也有非结构化数据以及介于二者之间的半结构化数据。结构化数据简单来说就是数据库,如企业ERP、财务系统;非结构化数据是指因数据结构不规则或不完整、没有预定义的数据模型而不方便用数据库二维逻辑表来呈现的数据,如文本、图片、HTML、图像、音频、视频信息等。其中,非结构化数据占大数据总量的90%左右。随着爬虫(Python)、文本与音频识别、传感与成像、定位等技术的成熟与发展,非结构化数据的比例还将持续增大。除了以上三个特点,部分学者和实务人士还提炼了大数据的另一个特点——真实性(Veracity)存疑。大数据的来源广泛、形式多样且处理方法与过程难以被外界获知和了解,因此其真实性存在不确定性。