随着计算机、物联网等技术的应用与普及,网络空间中人、机、物交互、融合产生和获取的数据规模与速度极大提高,由此人类社会步入大数据时代。在这种情况下,如何在海量数据中挖掘到与被审计单位相关的各种有用信息,准确高效地获取审计证据,是审计人员必须面对和思考的问题。由于研究范围仅涉及证据收集切入点选择等问题,因此,通过引入信息生成传递及决策树模型,将重点放在对同一经济活动信息集合中信息链环上的上/下位信息及其相互关联等方面。 一、上/下位信息概念、成因及其表现形态 (一)从信息生成规律分析 审计中审计主体接触到的各种信息,均属于被审计单位相关经济活动的自在信息、自有信息和记录信息集合。其中,自在信息是经济活动以信息方式向外部世界显示的存在和特征,在转化为人类大脑记忆或者机器智能、信息系统信息及通过一定载体记录为文字、符号、电子数据等信息之前,人类意识不到它,更谈不上认识它。这类信息遵循了物质世界物理学定律,在时空上位置指向唯一。如未经计量的用户照明、动力等电能。这种随时间变化处理的信息,是经济活动信息集合中的底层信息(初始信息),是自有信息和记录信息的唯一来源,是认识信息时空序列的客观依据。在数字化时代,这些信息通过交互式应用系统(如Web系统、互联计算机集群——云系统、电子商务系统等)、嵌入式应用系统(如移动电话中使用的软件)、数据采集系统、批处理系统运行顺序输出生成记录信息。如电网企业通过集中抄表终端(或公用变压器采集终端)对低压电力用户电能数据和配电变压器用电量及运行参数的实时采集的数据;通过单片机(主控MCU模块,又称中心单元)将实时采集数据经过处理、控制,输出、上传到采集终端器和主站数据库等数据。这些数据保持了经济活动发展踪迹,体现了被审计事项的时序构成,组成了信息集合原子性(不可分割)、序列化链环。这种同一信息集合中含义相互关联、相互承续,时空位置相邻、生成顺序邻接的信息称为链环信息。 当链环信息成为审计对象时,审计主体会根据审计假设或命题信息需要,将审计取证切入点或者审计观察点前后相连的链环信息划分为上位信息与下位信息。这种划分是信息含义上的划分,与信息载体独立与否无关。其中,上位信息是下位信息的部分或全部来源,下位信息是上位信息含义的承续,是上位信息这个“因”或“前提”基础上产生的“结果”。审计中,如果上位信息得到查实,那么与其相关联的下位信息自然也就得到查实。反之,下位信息所蕴含的上位信息就不可能得到查实。查证属实、符合经济活动时空次序的上位信息属于确定性信息,而确定性信息是形成审计证据的基础;下位信息与当下审计命题或假设无关,是另一事项信息,相对于特定被审计事项而言,它属于非相关信息,而非相关信息不能作为证据使用。如果下位信息可以证成上位信息,实质上就是错误预设了下位信息已经隐含了上位信息被证明的事实,用需要证明的事实去证明事实自身,其逻辑推理的结果必然是死循环,违背了逻辑规律。 为便于理解,举例说明。如审计主体在审查某国有企业员工出差费用报销的真实性时,记载这项经济活动的记账凭证以及相关的明细账、总账记录等下位信息就不能作为证明员工出差的证据使用,作为证据使用的只能是员工出差申请单以及车船票、住宿费发票等上位信息。 从信息生成来源考察所获得的上/下位信息,属于实质性的上/下位信息,它是审计取证定位及方向选择的客观依据。 (二)从计算机软硬件体系结构中数据流的规律分析 在现阶段计算机的计算模型下,无论是传统的控制流计算模型即计算机内的数据按指令循序操作模式,还是大数据处理平台上以数据流为核心的数据流计算模型即新型数据驱动方式处理生成的数据,都是按上一个数据计算处理完成,将结果传递给下一个计算单元操作执行这一顺序进行的。各种信息系统在需求描述、设计、开发以及运行中均遵循了经济活动的规律,体现了实际业务流程,具有严密的逻辑性。编程语言也提供了相应的实现语句。例如,C++程序设计语言就提供了多种不同的控制流语句,其中顺序执行的语句规定:第一条语句首先执行,然后是第二条语句,以此类推。现阶段,被审计单位各种交互式应用系统、嵌入式控制系统、批处理系统、数据采集系统、集成式系统等,所采用的计算机语言和解决实际问题的算法,都是按经济活动时序关系或程序设计语言事前确定的方向和有限规则操作步骤设计运行的,反映了被审计单位经济活动数据处理的过程与流程,体现了经济活动信息含义的递归关系,如货币资金=库存现金+银行存款+其他货币资金,总是从“库存现金”到“银行存款”和“其他货币资金”的值计算“货币资金”的值。 计算机软硬件体系结构中数据流所形成的上/下位信息属于形式上的上/下位信息,它是审计主体认识实质性上/下位信息的结构化、形式化载体。 (三)从智能化审计软件推理过程分析 随着人工智能(Artificial Intelligence,AI)技术的快速发展及其在金融、交通、商业、电信、电力等领域的广泛应用,被审计单位生产经营活动过程中人、机、物交互、融合所产生的并在互联网上获得的数据也将越来越多。适应这些大容量、多类型、集中化存储的海量数据的智能化审计软件,也将得到快速开发与应用。智能审计软件所采用的从初始事实(证据)出发,运用知识库中特定领域的基本原理、常识或经验知识,通过推理机逐步推出与审计命题或审计假设相关的审计结论的推理过程,系统性、结构化地体现了应用领域的规律和规则,反映了事实(前提)与结论、上位信息与下位信息的逻辑关系。如对某供电企业配网设备检修工程设计变更(签证)事项的真实性进行审计时,智能化审计软件会依据知识库中有关配网设备检修工程以及设计变更(签证)深/浅层知识,按以下步骤收集审查信息,固化相关证据:第一步,收集审查设计(签证)工程名称及变更卷册号、图号信息;第二步,收集审查设计(签证)事项内容、相关施工措施、纪要或协议信息;第三步,收集审查变更图纸、照片、示意图信息;第四步,收集审查变更工程量信息;第五步收集审查变更费用计算书信息;第六步,收集审查设计变更工程安全质量稽查信息;第七步,收集审查设计变更工程监理、中间(隐蔽)工程验收及工程竣工验收等信息。至于该工程设计变更后续的结算(决算)、财务转资等信息,由于属于上述流程中的下位信息,因而不得作为证明本事项的证据使用。