论大数据形势下的计算机审计专家系统

作 者:

作者简介:
宋静静,广东省计算机审计中心

原文出处:
广东审计

内容提要:


期刊代号:V3
分类名称:审计文摘
复印期号:2013 年 08 期

关 键 词:

字号:

      大数据(Big Data)时代来临,数据处理级别已经从传统的MB,变迁至TB,甚至PB,在4P(Product、Price、Palace、Promotion)价值观与营销观下,随之而来的4V(Volume、Variety、Value、Velocity)信息变革已经来临,比如说FACEBOOK现已处理了400亿张照片,而如将其用于解码人类基因,原需要计算机处理10年的时间将能缩短为一个星期内实现。每5天沃尔玛将处理超过100万客户的交易,而每隔1小时其进口量数据库将超过2.5PB,相当于美国国会图书馆书籍的167倍。信息化的高速发展给审计人员的培训带来了新的挑战。审计人员培训是否还能因循守旧?信息滞后、知识缺乏更新换代的弊病是否会体现在审计人才上呢?当前,我们要考虑的不仅仅是如何处理大数据,更重要的是考虑如何在这一背景下加速对人才的培养,提高成才的效能,使得人才成为常青藤等等问题。由此产生的计算机审计专家系统,则是使常青藤可持续发展、可进一步常青的时代“利器”!

      与时俱进,大数据下立“专家”

      在大量结构化、半结构化和非结构化的大数据面前,知识体系结构也在不断变迁与深化。如果说审计人员以前只需精于会计,那么时至今日,审计人员还需具备法律、经济、金融、管理、计算机等各行业领域知识方能胜任高层次的审计工作。复杂、交叉而涵盖面广的知识结构与体系,使得当前审计人员的培养、培训和再教育变得日益困难,甚至是瓶颈所在。在旧的技术方法与环境下,培养一名审计专家相当艰深。审计专家不仅需要对专业、非专业这些领域知识的复合、充分掌握,还需要通过长时间项目、案例的经验积累,最终才能破茧而出。如此的人才培养方法,显然已经不能满足当前形势的发展以及审计工作的高质量和高标准的要求。另一方面,即便审计人员经过长时间的培养成为了审计专家,但是各种高新科技支持下的隐蔽犯罪方法,也会使得专家的过往知识变得陈旧,导致专家不“专”。

      信息化时代的大数据背景下,如何才能借助日新月异的信息化技术提升审计人才队伍的业务水平呢?如何使得审计人员能够通过各种高新技术手段与方法的培训和锻炼,加速脱颖而出?又如何才能有效缩短审计人才培养所需的长时间经验积累和学习时间呢?一个“见多识广”、与时俱进、具有专家水平的信息化培训系统——计算机审计专家系统(Expert System)势在必行。

      专家系统是一个智能计算机程序系统,内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。也就是说,专家系统是一个具有大量的专业知识与经验的程序系统,它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供的知识和经验,进行推理和判断,模拟人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题。其是人工智能中最重要、也最活跃的一个应用领域,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。

      由于专家系统具备了大量的相关领域的专业知识与经验,其一方面可以作为人员培训的有效高能系统,另一方面也能成为专业人员的专业分析工具。然而,这样一个专门的人工智能系统要最终落实到实际应用也不容易。

      从专家系统的体系结构看来(如图1),一个良好的计算机审计专家系统不是一蹴而就的。在它的成长过程中,首先要吸收大量的专家知识,通过和审计人员的交互,学习大量审计知识、法规和案例,学习审计领域分析问题和解决问题的方法。接着它会把这些知识都储存在它的大脑知识库里。然后把这些大脑里的知识,通过自己的脑神经系统(推理机和数据挖掘机制)不停地学习和自学习,不停地将新生成的知识存在大脑里,然后又重新将它们运算,最后才能为审计人员提供智能分析与决策支持。

      

      然而,不同专家的知识在专家系统的脑海里,会造成一定的冲突和矛盾。针对旧有人工智能基于逻辑推理与符号演算的体系,绝大部分领域的专家系统都不能计算和学习完整完全、甚至有效学习部分专家的经验和知识。因为相关专家知识和规则的整理和搜索算法是系列NP问题(Non-Deterministic Polynomial,非确定多项式),其搜索空间的膨胀与爆炸使得逻辑规则的推理与演算存在了瓶颈。

      传统专家系统是基于逻辑与推理,然而大数据时代的来临却推翻了这一结论。我们能发现大量事实上关联而表面上却难以发生任何联系的事物及问题,例如在德国一家超市里面,技术人员通过数据挖掘(Data Mining)发现,大部分年轻爸爸在买了纸尿片以后,都喜欢顺手买几瓶啤酒,于是该超市将风马牛不相及的啤酒与纸尿裤捆绑促销,最终他们在一片惊讶声中大获全胜。

      看似偶然的事件,其实却是必然,上述促销事件的成功正是由于其取信于“数据”说话。而在大数据背景下,类似可以借鉴的案例与事物层出不穷。例如审计领域,“审而计之,审而慎之”是审计的实际技术特点。“审而计之”实际上就是数据说话,“审而慎之”更是体现审计过程中各种繁琐、细致、海量数据带来的困难和杂症。因此,审计领域的专家系统不需要有太强的推理能力,不需要太“聪明”,但是却要具备很强的计算能力和问题发现能力。而如果没有大量数据做支撑,仅凭少量数据挖掘出来的事实与规则是难以服众的。

      其实,审计实施系统(AO)和数据中心的建立,已开始为我们积累了大量数据。过去,数据是“消费型”数据,用完即止,难以复用。而现在,通过对这些数据的再挖掘与复用,易于形成知识与案例,一方面可以满足人才培养的需要,另一方面也为专家系统的建立提供了基础与先决条件。可以这么说专家系统的建立已经为时不久。

相关文章: