审计人员的职责就是从数据仓库所包含的海量数据中获取有用的审计证据,并发表适当的审计意见。在此环境下,利用数据挖掘技术能够实现对大量原始数据进行审查和分析,从中寻找出一定的数据特征,发现可疑数据,以提高审计工作效率,降低审计风险,最大限度地保证审计质量。 一、数据挖掘技术是提高信息时代审计工作质量和效率的重要工具 数据挖掘是信息时代背景下发展起来的新兴技术,利用该技术可以从数据库中提取隐含的、未知的和潜在的有用信息,帮助审计人员进行数据分析,以便发现异常信息。利用数据挖掘技术对被审计单位的海量数据进行发掘式审计,是现代审计技术方法一大突破,也是信息技术发展的尽然结果,具有开拓性意义。 数据挖掘式审计是适合现代信息技术环境的一项新型审计取证方法。审计系统中引入数据挖掘技术,显示出巨大优势,这是现代审计技术方法发展的一次飞跃。 数据挖掘技术在审计中的独特功能是传统审计方法无法取代的。每一个被审计单位的计算机系统甚至其网络中都蕴藏着大量的财务或非财务电子数据,传统的审计方法面对被审计单位错综复杂的环境和海量数据,显得束手无策,只有利用数据挖掘技术,才能完成审计工作。数据挖掘作为一种先进的信息技术,能够帮助审计人员在极短的时间里筛选出具有代表性的审计样本,在一定程度上降低了审计风险。只有进行全面审计,才能有效消除抽样审计风险,而数据挖掘软件的运用,使全面审查被审计对象总体数据成为可能。 数据挖掘技术还可以发现信息系统中的非法入侵数据,以确认被审计单位信息系统的安全性,拓展审计的边界。随着数据挖掘技术的迅猛发展,通过对大量被审计单位日志数据进行系统分析,可以建立自动化的非法入侵检测系统。 二、数据挖掘审计法的基本路径 数据挖掘是在对数据全面而深刻认识的基础上,对数据内在和本质的高度抽象与概括,也是对数据的认识从感性到理性的升华。审计人员利用数据挖掘技术,从原始数据起步,深入到详细数据当中查找证据,通过对数据的深入分析,寻找并发现数据规律,借以发现异常现象。利用数据挖掘技术进行审计的基本路径如图1所示。
图1 数据挖掘审计的基本路径 首先,接收被审计单位的数据日志,收集系统信息,并要求各部门提交统一格式的审计数据。数据挖掘技术运用的切入点就是获取大量的数据,这既是数据挖掘式审计的工作起点,也是其最为重要的一个环节。 其次,对获得的审计数据实施预处理,其工作包括格式转换、数字净化、提炼等。从被审计单位获得的原始数据可能是杂乱无章的,往往存在一些干扰项,不利于审计人员从中发现问题。因此,审计人员应将原始数据转换成审计人员可识别的格式,并剔除干扰项目,使数据能真正反映业务的真实规律,以便控制数据挖掘的准确性。 第三,运用合适的数据挖掘算法对审计数据进行处理,发现数据中隐藏的规律,并寻找异常数据。审计人员可根据不同被审计单位的行业背景、业务特点和数据模式,运用关联规则发现、序列模式挖掘等不同数据挖掘技术方法,获得被审计单位的数据规律,以检测是否存在异常。 第四,数据统计,并根据统计结果进行审计职业判断。统计的信息包括业务规模、异常数据、识别失效和业务流程违规等情况,这既是审计工作的核心,也是数据挖掘技术在审计中运用的主要成果的体现。 最后,审计人员应系统进行审计数据的分析处理(OLAP)及趋势预测分析。审计人员根据数据分析,可以进一步判断被审计单位存在的问题,并指出改进方法和思路。 三、数据挖掘式审计的主要技术方法 审计人员通过数据分析获得审计线索,确定疑点并排除、落实的过程,实质是发现问题并对其进行检测的过程。运用数据挖掘技术获得蕴涵在数据内部的模式、规律,从而发现经济业务的异常。在审计业务工作中,可利用离群点挖掘、孤立点检测、异常点检测、聚类分析、关联规则发现、分类和预测、序列模式挖掘等方法,获取有效的审计证据。 离群点挖掘技术就是通过发现和分析明显偏离其他数据、不满足一般模式或规律数据的离群数据,找到有价值审计信息的一种技术方法,即从大量复杂的数据中挖掘出存在于小部分异常数据中的新颖的、与常规数据模式显著不同的数据模式。离群数据的分析可能比一般数据包含更有价值的信息。如审计人员在对销售收入进行审查时,可以根据以往的经验分析出其销售业务的基本规律,再利用离群点挖掘技术,对本年度销售数据进行分析,可以将偏离正常业务范围的异常数据进行割离,并对其进行仔细审核,这样就大大节省了审计资源。此外,审计人员还可利用此技术自动从被审计单位销售数据中提取业务模式和管理行为模式,从而减少人力投入,减轻审计工作人员负担,提高审计结论的准确性。 孤立点检测是数据挖掘的一项重要技术,用束发现数据源中显著不同于其他数据的对象。在审计数据源中,经常含有一定数量的异常值,它们与审计数据源的其他数据不同或不一致,通常将这类数据称为孤立点(Out-lier)。孤立点是数据源中与众不同的数据,怀疑这些数据并非随机偏差,而是产生于完全不同的机制。由于审计中的可疑数据往往表现为孤立点,可能是度量或执行错误所致,也可能是固有数据变异性的结果。故通过检测并去除数据源中的孤立点,可达到数据清理的目的,从而提高数据源的数据质量;采用孤立点检测的相关算法来处理审计数据,可以达到审计目的。如在对企业产品生产成本进行审查时,可以利用孤立点检测技术,将可能存在的与生产技术指标数据相差较大的成本数据剥离出来,审计人员再用该企业具体生产指标对这些数据进行逐一审查确认,以发现舞弊现象。