数据挖掘技术在信息系统审计中的实际运用

作 者:

作者简介:
陈力佳,常州市审计局

原文出处:
江苏审计

内容提要:


期刊代号:V3
分类名称:审计文摘
复印期号:2011 年 08 期

关 键 词:

字号:

      数据挖掘是指从大量不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中、人们事先不知道的但又是潜在有用的信息和知识的过程。数据挖掘在信息系统审计过程中发挥着举足轻重的作用。因为它不仅可以对信息系统产生的被审计单位财务、业务数据进行深层次分析和研究,揭示其本来特征和内在联系,而且可以通过模型匹配和挖掘算法实现其在信息系统开发审计、安全审计等方面的应用。此外,通过数据挖掘技术与信息系统审计技术的有效结合可确定快照技术中快照点的选择问题,以及确定系统控制审计复核文件中嵌入审计程序应采集什么信息。

      一、数据挖掘技术在信息系统审计中的运用研究

      数据挖掘技术很多,笔者在此仅列举目前最有可能运用于审计工作中的几种常见技术。运用这些技术可以实现对被审数据进行综合分析处理,从而提高信息系统审计的效率和质量,降低审计风险。

      (一)运用统计分析技术发现偏差数据

      统计分析技术是指利用统计学原理对数据库字段项之间存在的函数关系或相关关系进行科学分析的方法。具体方法包括常用统计(求大量数据中的最大、最小、汇总、平均值等)、回归分析(用回归方程来表示变量间的数量关系)、差异分析(从样本统计量的值得出差异来确定总体参数之间是否存在差异)等。

      该技术是目前数据挖掘在审计工作使用的较为成熟的技术。审计人员通过建立统计模型对搜集的被审计单位以及同类型单位的大量财务、业务历史数据进行分析,挖掘内部存在的函数关系或相关关系,然后对审计期间内的相关数据进行合理预测。通过将分析的预测值和审计值进行比较,从而帮助审计人员发现疑点。例如对某些财务指标进行深层次挖掘,可以发现异常指标数据,获得审计线索。

      统计分析技术在信息系统开发审计阶段同样可得到很好的运用。作为开发阶段审计的重中之重就是对信息系统项目进度与成本费用的控制审查。审计人员通过借鉴同类型项目经验数据,对项目进度与成本费用建立统计分析模型,按照项目计划预测出实现预定进度所发生的成本费用,然后与项目实际发生的费用进行比较,判断成本费用是否得到有效控制。通过对偏离较大支出实施进一步审查,确定项目实施过程中资源是否合理配置,有无存在损失、浪费等不合理支出情况。

      (二)运用聚类分析技术确定审计重点

      聚类分析就是把一个数据集分解或划分成不同的组,使同一组中的对象尽可能相似,不同组中的对象尽可能相异。通过聚类,容易识别出密集的和稀疏的区域,发现全局的分布模式和数据属性之间的相互关系。

      在审计过程中,通常是利用聚类分析技术对信息系统中被审计单位的同类型的财务数据或者业务数据进行分组,使其成为有相似特性的聚集。一般说来,财务数据及重要业务数据(如销售数据)的变动具有一定的规律性。所以如果某些数据处于稀疏区域,说明其变动表现异常,需要重点关注。同时通过观察该区域记录的特征,可以发现审计需要查证的问题特征。

      审计人员在对信息系统安全审计中,可以借助该技术实现对计算机日志的审查。计算机日志记录了计算机系统发生的各种重要事件,通过它,可以了解系统运行状况,审核安全事件,发现差错异常,从而对系统安全给予全面评价。但是计算机日志种类繁多、格式差别巨大,大小呈级数增长,也给审计人员带了巨大工作压力。在这种情况下,聚类分析起到了事半功倍的作用。审计人员将收集到的同类日志数据导入到数据挖掘于具中,如SQL2005中的Microsoft Analysis Services工具,选择聚类挖掘模型,就可利用其强大的分析功能实现日志数据的分类,“魔法般”地将非正常的日志记录从正常的日志数据中区分出来,例如登录时间在半夜的日志记录,暴力攻击的日志记录等,为后续审查评价提供了线索。

      (三)运用孤立点分析技术挖掘审计疑点

      孤立点是指明显偏离其他数据,即不满足一般模式或行为的数据。孤立点分析是数据挖掘中的一项重要技术,用来发现数据源中显著不同于其他数据或行为的异常数据和异常行为。

      在常规审计中,被审数据的孤立点往往是审计人员依靠职业敏感,凭借一双“火眼金睛”来发现的。而面对海量的电子数据,审计人员则需要利用计算机强大的数据分析能力,采用孤立点检测算法,发现异常审计数据或异常发生频率等,从而发现有可能隐藏的违规行为。特别要强调的是,孤立点分析方法如与信息系统审计技术实现有机结合,能够达到更为理想的效果。利用这种方法确定孤立点后,审计人员可将审计样本选在孤立点数据上,通过采用信息系统审计技术,如利用快照点捕捉问题数据,利用嵌入式审计模块进行实时监控等方法,达到锁定疑点数据的目的。

      例如,在某医院信息系统审计项目中,审计人员选取了该院门诊处方明细库上半年度的全部数据,对半年内向同一病人开同一种药品的处方数在两张以上的处方所间隔的天数进行了孤立点分析。结果表明与正常数据分布图形态相比较,出现了若干处明显的低值。孤立点分布在0~2天。经延伸审计,发现该院存在大处方开药情况。于是,审计人员将审计样本选在孤立点数据上,利用快照技术迅速在全年度数据中捕捉到了疑点记录,大大提高了审计效率。

相关文章: