大数据审计云平台、审计大数据标准体系是实现审计大数据分析的基础设施,审计大数据分析模型要素是发现审计线索、解决审计问题的直接生产工具,模型构建是否科学直接影响审计大数据分析的效果。科学审计模型的构建是一项科研性很强的工作,需要对审计业务的全面深入认识和对计算机实现算法的深刻理解,并将二者有机结合、高度统一。 一、审计大数据分析模型分类 (一)基于审计专家经验的查询类大数据分析模型 此类审计大数据分析模型依赖于审计实践中形成并已被证明有效的经验,是基于已知经验知识构建的大数据分析模型。基于对审计业务中实体间相互关系的全面清晰描述,将审计专家经验应用于审计大数据分析,形成SQL语句等计算机执行语言构成的查询类大数据审计分析模型。通过查询类大数据审计分析模型实现审计专家经验的知识化、模型化,让经验以知识的形式得以固化和传播,以模型的形式得以快速推广和应用,产生实际的审计生产力。 (二)基于机器学习的数据挖掘类大数据分析模型 基于机器学习的数据挖掘类大数据分析模型发现的是事先没有已知经验的审计知识和规律,是机器学习算法通过对大数据中隐藏知识的挖掘,来发现审计线索和分析解决审计问题。 二、审计大数据分析模型构建 (一)基于审计专家经验的查询类大数据分析模型构建 一是对全国现有的基于审计专家经验的查询类大数据分析模型进行分类、改进和完善。按行业对现有的审计大数据分析模型进行分类整理。2004年至2012年,审计署连续开展了七届计算机审计专家经验和计算机审计方法征集工作,共征集评选出3683篇计算机审计专家经验和计算机审计方法。2013年和2015年,审计署审计科研所开展了两次全国审计机关技术创新情况专题调研活动,出版了《审计技术创新发展报告及案例选编2013》《审计技术创新发展报告及案例选编2015》,分别发布了155篇和119篇审计技术创新案例。上述计算机审计专家经验、计算机审计方法和审计技术创新案例是多年来全国审计机关宝贵经验的积累和总结,可以对其进行更新和完善,构建种类比较齐全的基于审计专家经验的查询类大数据分析模型库。 二是目前可在审计专网建立审计大数据分析模型众创和共享平台,集全国审计人员智慧,不断添加新的大数据分析模型。在保证信息安全的前提下,可由全国审计人员在统一平台上,针对相同或相近的审计问题交流经验、共同开发、开源共享代码,充分发挥全国审计人员的积极性和创造性,推动构建具有时代性、实用性的审计大数据分析模型。 (二)基于机器学习的数据挖掘类大数据分析模型构建 一是以科研攻关的形式逐一攻克基于机器学习的数据挖掘类大数据分析模型构建难点。构建数据挖掘类大数据分析模型的门槛相对较高,需要对深度学习、支持向量机、人工神经网络、决策树、贝叶斯、最小二乘等算法的数学机理透彻理解,实现计算机语言的熟练运用,才能实现对审计大数据的分类、关联规则、聚类、时间序列等数据挖掘分析。这类数据分析工作本质上是科研创新工作,对数据、人员素质和科学组织管理的要求都较高,需要以科研课题、科研攻关的形式逐一明确问题、逐一立项,进行专项科研攻关来解决。 二是需要梳理和归纳可以通过数据挖掘模型解决的审计问题,构建人工智能审计问题库。目前的机器学习算法适合解决分类、关联规则、聚类、时间序列等问题。并不是所有的审计问题都能够使用机器学习工具分析,因此需要将基于机器学习的数据挖掘类和基于审计专家经验的查询类相结合,共同构成审计大数据分析模型体系。正是因为基于机器学习的数据挖掘类大数据分析模型有其特定的应用场景,需要系统地梳理审计业务问题,分门别类地构建出可以用机器学习工具挖掘分析的人工智能审计问题库。 三是需要在深刻洞悉审计问题和深入理解与审计问题相匹配的机器学习算法的基础上,进行大量数据分析实验,构建基于机器学习的数据挖掘类大数据分析模型。这项科研工作需要审计专家和大数据分析专家深度合作,将两个领域的知识有机结合起来,研究出切实解决实际问题、高效准确的大数据分析模型,为实现智能化审计添砖加瓦。 三、审计大数据模型构建实践经验总结 (一)成都市审计局大数据模型建设经验 成都市审计局整合现有的计算机审计分析方法,以大数据处理技术为手段,创新推出了一套大数据审计模型,让复杂的审计问题模型化,便于审计人员学习掌握和运用操作。在此基础上,进一步推出了自动化、形象化、可视化的数据分析功能,让审计人员能够直观地接受和使用大数据模型开展分析工作,提高审计发现疑点线索的能力。 成都市审计局通过搜索引擎式查询技术实现审计大数据分析低门槛化。除了将成型的各行业数据分析方法固化形成模型外,还将各区(市)县的审计模型添加到平台中,形成一套不断扩大的审计方法模型体系。目前已建立了部门大数据审计模型方法体系、企业大数据审计模型方法体系、专项资金大数据审计模型方法体系、自然资源资产大数据审计模型方法体系和区(市)县大数据审计模型方法体系,如温江区审计局开发了工程苗木及建材价格信息审计模块,崇州市审计局开发了工程造价审计模块,郫都区审计局开发了拆迁资金大数据审计模块等。