目前,AO中审计数据采集与转换主要存在以下问题: 1.缺少对采集到的被审计单位数据的清理加工 由于实际条件的限制,在采集数据时,往往不可能对被审计单位的信息系统和数据库结构做详细的了解和分析,因而很难确定哪些数据是重要的,哪些是不重要的。为保证数据的完整性,一般是确定一个采集范围后,采集该范围内被审单位全部数据,因而采集的审计数据往往会有许多相似重复记录;且由于被审单位财务人员操作上的失误和财务软件自身的缺陷,导致采集到的数据中有些数据属性的值不确定或缺失,从而给审计分析带来风险。除此之外,实际审计分析中并不需要对数据库中所有数据表进行审计检查,因而需要对采集来的数据进行清理筛选和加工合成。 AO的数据采集模块包含三种数据采集方式:国标数据采集,备份数据采集以及数据库数据采集。这三种数据采集方式都是筛选出被审单位数据库中的三张表:科目表、余额表和凭证库表后加以采集,并没有对采集到的数据中的相似重复记录、不完整记录和错误记录进行清理,将产生数据冗余和错误,加大审计实施的工作量,增加审计实施成本。 2.主要针对数据量较小的采集,海量数据采集不便 目前审计机关使用的多是单机版AO,当被审单位数据量较小时,可直接采集被审单位采集范围内全部数据。但当被审单位数据量较大且又无法通过财务软件备份时,直接采集全部数据会给审计人员计算机造成很大压力,数据采集人员就需要从被审单位数据库或前台客户端导出审计分析需要的表,然后以数据库数据的方式导入到AO中。采用这种方式,数据采集人员需要对被审单位数据库结构和采用的财务软件系统有详细的了解,可能降低审计工作效率,提高审计成本。 3.难以保证采集到数据的一致性和准确性 按照审计法则的规定,审计方在实施审计工作之前都会拟定审计实施方案,并向被审单位送达一份审计通知书,要求被审单位提前准备审计所需的各项资料,并在审计实施过程中对审计单位的工作进行配合。送达通知书到开始审计之间的时间差就使得被审计单位有时间对账务进行调整,导致审计人员无法全面、准确的看到被审单位真实的财务数据,进而产生一定的审计风险。 针对以上问题,建议采用下列方法加以解决: 1.采集数据后,对数据进行清理 数据清理也称数据清洗(data cleaning,also called data scrubing),数据清理就是利用有关技术如数理统计、数据挖掘和预定义的清理规则,从数据源中检测并消除错误数据、不完整数据和相似重复数据,清除数据源中的相似重复记录以及错误和不一致记录,从而提高数据的质量。 可在AO中增加数据清理模块,对采集来的被审单位数据进行清理,以减少数据错误和冗余,使之满足审计分析的要求。 2.实施增量数据采集 单机版AO中,通过手动方式采集数据。当被审单位数据量很大时,就会给数据采集人员带来极大不便。实施联网审计后,海量数据所带来的压力就集中于部署在审计方的采集数据的服务器中。实施审计工作时,采用增量数据采集方式,配合增量数据审计分析方法,可减轻海量数据对审计方服务器造成的压力,同时提高审计效率。 3.在采集被审单位财务数据的同时采集被审单位对数据进行操作时产生的“指纹” 被审单位工作人员在对财务软件和数据库进行操作时,财务软件会对工作人员的所有操作进行实时跟踪,并记录在操作日志中,从而确保对财务软件或数据库的所有接触或改动都会留有“指纹”。操作日志文件中真实记录对财务软件进行的各种操作,财务软件的这一功能为进行计算机审计留下了线索。在采集被审单位财务数据的同时,采集这些“指纹”,就可通过查阅这些操作日志发现是否存在人为调账,从而保证审计数据的一致性和完整性,进而确保审计工作的有效性、准确性。 综上所述,电子数据的采集与处理是计算机机审计的先决条件,必须重视并做好审计数据的采集与处理工作,有效的降低审计人员的工作量,提高审计质量,规避审计风险,使计算机审计工作得以顺利开展。