注册会计师审计自诞生以来,虽然其根本目标并未发生重大变化,但是注册会计师审计的技术环境却发生了革命性的变化。进入21世纪以来,信息技术对社会、经济、生活等各个领域不断渗透和推陈出新,促进了人、机、物三元世界的深度融合,引发了数据体量的指数式增长和数据构成的高度复杂化,我们的世界已进入了网络化的大数据时代。在大数据的推动下,协同创造、虚拟服务等新型应用模式持续拓展着人类创造和利用信息的广度与深度,我们的时代正在步人“第三次工业革命”时代。植根于大数据,以全样本、模糊计算和重相关关系为特征的数据密集型科研范式,是继实验科学、理论科学和计算科学三类范式之后又一类新的科研范式。它不仅推动了科研方式的变革,也推动了人类思维方式的巨大变革。大数据的“4V”特征以及六大挑战,导致企业风险决策和运营模式正在发生颠覆性变革,传统的自上而下、依赖少数精英经验和判断的战略决策日渐式微,一个自下而上、依托数据洞察的社会化决策模式日渐兴起。 审计发展史在一定程度上也是一部审计技术发展史。审计技术的发展变迁是对社会技术发展的一种应致性反应。风险导向审计扬弃了制度导向审计的某些不足,但仍未摆脱制度导向审计的时代背景与理论基础的桎梏,使得审计期望差距并没有实质性缩小,仍然受到财务信息供应链各利益相关者的诟病。 注册会计师行业不仅是知识密集型行业,更是数据密集型行业。注册会计师应抓住大数据所带来的机遇,克服风险导向审计固有的局限性,以实现审计目标,缩小审计期望差距。鉴于大数据在审计学领域的研究与运用还处于起步阶段,本文从审计范围、风险评估程序理念、进一步审计程序以及审计证据四个方面研究了大数据对风险导向审计的影响。 一、审计范围:由最小数据集扩展到大数据 最小数据集(minimum data set)是指实验者为达到实验目的而必须收集的最小数据集合,其目的是通过收集最少数据,推断实验对象的总体特征,满足实验者信息交换的需要。最小数据集是面向业务过程的核心数据集合,是标准化、规范化、普遍认同的数据,是关系型数据与结构型数据。因此,相关法规规定了最小数据集的建立与设定;当没有法规规定时,由实验者根据实验目标、收集数据的成本效益进行权衡决定。 大数据是信息环境下人、机、物高度融合的产物,分为两种类型。第一种类型大数据是指企业在提供产品和服务时产生了大量的密集型、关系型与结构性的“海量数据”,对这些数据进行深入的挖掘分析,将形成正向的反馈循环,促进效率与效果的提高;第二种类型大数据是指在互联网上发生的如博客与网络浏览痕迹等,蕴含着丰富的、可被发掘的社会价值、商业价值或科研价值,但是这类数据多为半结构化数据或非结构化数据。两类大数据的差异性表现在:数据体量上(volume)第二类大数据是第一类大数据的3倍且两者差距日益扩大;第一类大数据是机与物融合的产物,具有关系性、结构性、稳定性的特点,而第二类大数据是人与机、人与物融合的产物,具有非结构性、社会性的特点。可见,最小数据集是第一类大数据中的子集,是理论科学范式下为证伪相关假设人为设定的产物。而大数据不预设相关假设,而是通过数据分析,来揭示研究数据之间的相关关系。 审计范围的确定是风险导向审计中一个重要的职业判断,直接关系到审计目标的实现、审计责任的解除与审计效率,但是审计准则对之并无明确的界定。对比《中国注册会计师审计准则第1101号——财务报表审计的目标和一般原则》(2006)与修订后的《中国注册会计师审计准则第1111号——就审计业务约定条款达成一致意见》(2010),虽然审计范围有了实质性扩大,但是注册会计师在审计中,首先根据风险评估结果设定审计具体目标、确定审计对象,进而明确审计范围。审计范围确定的流程体现了“最小数据集”的本质,即对设定目标的一种证伪性。在大数据环境下,被审计单位自身就是一个大数据,因此,在确定审计范围时,应从数据密集型范式角度,尊重数据而不是运用拇指法则(rules of thumb)或以成本效益权衡原则为缘由任意缩小或放大审计范围。所以面对大数据,我们不能像小数据时代那样,依然用最小数据集获得有限的信息,而应该拿到被审计单位的全部数据进行审计分析,不论是第一类或第二类数据。正如管理大师戴明所说,“除了上帝,其他任何人都必须用数据说话”。 二、风险评估程序的理念:由“实验科学范式”转变到“数据密集型科学范式” 风险评估程序是风险导向审计的前提和基础,是审计准则规定的应当程序。风险评估程序实施的效果决定或影响审计资源的配置、控制测试程序与实质性测试程序的性质、时间与范围。自风险导向审计诞生以来,风险评估程序尽管在审计风险模型、起点、范围上实现了一定程度的改进,但是在理论指导、评估对象、审计技术上仍然没有摆脱“第二次工业革命”背景下的“实验科学”范式的桎梏。现行风险评估是基于小样本下的先验性证伪的实践活动。在风险评估过程中,通过对行业层次比较、过去经营成果与预算或计划比较以及横向各部门效率效果比较这三个方面对被审计对象进行分析性评估,并结合观察与检查审计程序,确定重要性水平、可能存在重大错报的领域,进而规划与实施进一步审计程序,来收集审计证据证实或证伪在风险评估过程中所形成的先验性假设,形成审计结论或审计意见。可见,这种以被审计单位运营信息系统数据为主、先验性的风险评估理念落后于以网络数据为主导的大数据时代下的“产业边界模糊化、产业组织网络化、产业集群虚拟化”的“第三次工业革命”及其“第四科学范式”。 范式是人们观察世界与改造世界共同遵循的世界观和行为规律,发挥着规范性的作用。范式不是固定不变的,它随着社会环境的变化而变化。在大数据时代下,新型统计分析算法就可以发现旧的科学范式下发现不了的新模式、新知识以及新规律。“第四科学范式”实现了由传统的假设驱动向基于数据进行探索的方法转变,它运用“横向扩展”(scale—out)体系结构以及将计算用于数据而不是将数据用于计算的理念,使其不同于“理论科学范式”和“计算科学范式”。随着人、机、物的高度融合,企业搜集的数据比以往任何时候都要多,不仅在企业内部,在外部的组织网络和更广泛的消费领域亦是如此。在新数字化企业及其周围的环境里,数据不仅仅是处理、研究的对象,更是组织的基础性、战略性资源。数据推动着企业的创新,并使各级组织的运营更为高效;数据同时也革新了人类行为决策模式。