数据挖掘技术在联网审计中的具体应用

作 者:

作者简介:
叶善锦,湖南省衡阳市审计局

原文出处:
中国审计

内容提要:


期刊代号:V3
分类名称:审计文摘
复印期号:2016 年 05 期

关 键 词:

字号:

      数据挖掘与联网审计的依存关系

      数据挖掘是一门交叉学科,涉及人工智能、数据库、统计学等多个领域。数据挖掘技术全面运用在联网审计中,是基于其具有审计知识和审计疑点的发现功能,可以在联网审计系统的海量数据中,发现数据之间的关系,挖掘出审计人员所需要的信息并转化成有用的知识或审计疑点,对强化审计质量、提高审计效率和降低审计风险有着重要意义。

      (一)常规审计处理数据方法的问题

      目前,审计人员在处理数据的过程中,最常用的方法是数据的查询与比对,本质是对传统审计在信息化领域的延伸,没有实现信息化手段对审计的拓展,即当前的数据式审计是审计手段形式的转换,而不是审计方法的本质变革和创新。因此,以问题假设为前提的验证性审计,无法发现数据之间的内在隐含关系,难以从技术上拓宽审计外延,无法从本质上实现审计由问题分析向管理分析和绩效分析的转变,不利于从抽查式审计向全覆盖审计的转变。

      (二)数据挖掘的技术优势

      数据挖掘是从大量的、不完全的、有噪声的、模糊的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。数据挖掘可以对所发现的知识进行可视化,将挖掘结果转换为用户易懂的表示方法(见图1)。

      数据挖掘技术在联网审计中的具体应用

      运用数据挖掘技术产生数据模型,再用数据去检验模型。模型的构造是从特殊到一般的归纳过程,从而摆脱了前提假设的束缚和主观因素的干扰,使结果更加真实、客观。对具体的审计应用而言,数据挖掘的本质是在数据采集与提取后,通过运用聚类分析、关联规则分析、决策树、神经网络和孤立点检查等数据挖掘技术手段,分析数据之间的含义,寻找和确定审计疑点。如湖南省衡阳市审计局在2012年的社会保障资金审计中,通过对患者的医疗发票金额进行趋势分析和相似度分析,发现其中的内在含义,从而判断是否存在利用假发票和医疗资料骗取医保资金的情况。

      

      (一)构建数据挖掘统一平台

      在审计实务中,鉴于审计分析的智能性和实时性,具体做法是在数据分析处理过程中加入审计人员的思考和经验判断,即在联网审计中建立实时交互的人工智能数据挖掘支撑平台。如在联网审计的应用中,将数据分析人员与审计人员合编成组,在分析过程中加入审计的具体做法,对信息进行提炼和分析,从而形成与审计密切相关的分析过程,从外部看来,就是一个整体的对外接口(见图2)。

      

      (二)建立数据挖掘沟通渠道

      在数据挖掘的平台建立完成后,完善内部的沟通机制是数据挖掘的重中之重,审计人员与数据挖掘人员就需求达成一致,是项目成功的关键。因此,在这一过程中,审计人员和数据挖掘人员需要大量的沟通和了解,审计人员向数据挖掘人员提出需求,数据挖掘人员根据需求建立挖掘模型和方法并征求审计人员的意见,依次反复,直至提出有效的挖掘方法,制订科学的挖掘方案。

      另外,还须注重两个方面。一方面,积极对现有的审计人员和技术人员进行培训,强化其对数据和审计的认知程度,实现传统审计知识与数据挖掘技术和联网审计有机结合;另一方面,将审计人员和数据挖掘人员编成数据分析组,通过合作的方式完成整个数据挖掘过程,这也是目前常用的一种模式。

      (三)建立数据挖掘技术的灵活运用机制

      审计是一项综合性的工作,遇到的情况复杂多变。数据挖掘面对的信息是杂乱的,没有现成的规律可循,因此,每一次审计数据挖掘都是一次审计方式方法的创新。在这一过程中,需要综合并灵活运用数据挖掘方法,如通过绘制波动曲线图,可以发现孤立点并进行分析,提取的关联可以应用在评估被审计单位重大错报风险中,也可以用在内部控制测试程序中,还可以用在建立审计分析模型和审计预警模型中。因此,基于数据挖掘技术的联网审计不是一成不变的程序或教条,应是基于数据挖掘技术手段的灵活交叉运用,本质是一种数据挖掘思想在审计过程中的应用。

相关文章: