KPI(Key Performance Indicators,关键绩效指标)是一种用于评测企业业务绩效的目标式量化管理指标,经常用于评估一段时间内企业的运营情况。目前常用的确定KPI的方法是因果图分析法,可以帮助人们在实际工作中抓住主要问题,解决主要矛盾,并找出引起问题的潜在根本原因。在实际应用中,问题的特性总会与一些因素有关,因此在用因果图分析法确定产生问题的根本原因之前,首先要通过头脑风暴法找出这些因素,然后将它们与特性值一起,按相互关联性进行整理,最终形成层次分明、条理清楚、标出重要因素、形成表达要因的图——因果图。由于因果图的形状很像鱼骨,因此也被称为鱼骨图,是一种透过现象看本质的分析方法。 计算机审计预测分析 计算机审计是根据被审计单位的电子数据,通过对数据的分析,发现并找出其中存在问题的过程。目前主要的数据分析方法有三种:一是二维分析,主要通过编写针对二维表的SQL查询语句实现。这种方法适合进行个体分析,即对锁定的重点进行细致的分析。二是多维分析,通过构建多维数据集,从多个角度对数据进行分析,这种分析方法主要用于快速把握总体,锁定分析重点。三是挖掘分析,通过构建数据挖掘模型,对隐藏在数据背后的信息进行深度的探究,找出隐藏在数据中的有价值信息。这种分析方法可以方便地发现与要分析的数据有密切关系的关联信息,还可以预测数据的发展趋势。审计人员通过挖掘分析方法不仅能预测被审计单位的风险,而且能提出相应的预防措施及建议。 KPI是建立在多维数据分析基础上的,与多维数据分析配合使用。虽然在日常业务中KPI主要用于衡量企业的一些指标性业绩,但经过研究发现这个技术也可应用在审计数据分析中。通过在多维分析中设置合适的KPI值,并结合数据挖掘技术,可以预测和发现各种问题产生的原因及其发展趋势。 在进行审计预测分析时,我们将实现步骤总结为三个过程:一是通过数据挖掘算法,找出数据之间的关联关系,提出审计分析的关键属性和属性值;二是运用多维数据分析方法观察数据挖掘算法确定的审计分析关键属性,验证关键属性数据;三是在多维数据集上设置KPI,进一步详细了解关键属性的数据状况和走势。确定了这些信息之后,审计人员一方面可以给被审计单位提出预警建议;另一方面,可以进一步详细了解这些数据的相关信息,确定问题产生的原因。 审计预测分析的实现 以某银行信贷数据为例,以SQL Server 2005作为实现平台,说明数据挖掘技术和KPI技术在计算机审计预测分析中的应用。 1.数据简介。 某银行信贷数据库经过数据清理和转换后产生如下两张分析表:一是“贷款分析表”。包含的基本信息有:客户代码、贷款日期、正常、关注、次级、可疑、损失、不良贷款、正常贷款。其中不良贷款和正常贷款根据五级贷款计算得到,计算公式为:不良贷款=次级+可疑+损失;正常贷款=正常+关注。二是“客户分析表”。包含的基本信息有:客户代码、客户名称、公司法律责任形式、客户类型、经济性质、隶属关系、客户状态、重点标志。 2.确定关键属性及属性值。 要对不良贷款情况进行重点分析,首先需要确定与不良贷款关系最紧密的几个关键属性。利用SQL Server 2005平台,为贷款数据分析构建决策树算法和关联规则算法的数据挖掘模型。通过决策树算法可以确定与不良贷款关系最紧密的一个或几个属性,通过关联规则算法可以进一步确定这些属性中的哪些取值更能左右不良贷款情况。如图1所示为在构建好的决策树挖掘模型中,通过“依赖关系网络”图看到的与不良贷款关系最紧密的关键属性,可以看到是“重点标志”。通过逐渐降低不良贷款与相关属性的关联程度,可以逐步找到与不良贷款关系密切程度次之的关键属性。通过该方法发现从重要到次重要的四个关键属性依次为:重点标志、客户类型、隶属关系和客户状态。
图1 与不良贷款关系最密切的属性——重点标志 通过关联规则算法,可以进一步确定关键属性中的哪些取值对不良贷款影响比较大。通过关联规则中的“依赖关系网络”显示的情况可以发现,在不良贷款额高的情形中,“重点标志”属性中的“总行重点”是最关键的属性值;而不良贷款额低的情形中,“客户状态”属性中的“正常”是最关键的属性值。 在关联规则的“规则”选项卡上可以进一步观察各个属性取值对不良贷款的重要程度,在这个选项卡上列出了各种事件可能出现的概率,比如在低不良贷款中,客户状态为“正常”的概率是0.49,而在高不良贷款中,重点标志为“总行重点”的概率是0.464。通过对事件出现概率的分析,可以确定分析的重点。 通过上述分析,可以确定影响不良贷款的主要属和属性的主要取值,然后可将分析的结果绘制成一张因果图(鱼骨图),为后续的进一步分析做好准备。根据上述分析绘制好的因果图如图2所示。