金融审计大数据分析中的数据驱动分析法

作 者:

作者简介:
徐权,审计署金融审计司;隋学深,审计署审计科研所

原文出处:
中国审计

内容提要:


期刊代号:V3
分类名称:审计文摘
复印期号:2015 年 08 期

关 键 词:

字号:

      随着金融电子数据快速积累和存储容量的急剧膨胀,审计人员在单位时间内需要处理和分析的数据呈现海量化、多样化和复杂化的特征,审计数据分析面临很大挑战。但在大数据技术日趋成熟的情况下,金融审计数据分析迎来新的发展机遇,审计技术和方法体系将得以重新梳理和组织。

      数据驱动分析方法的概念

      在金融审计数据分析中,原有的审计思路和方法主要来自于:公开的指标体系和分析框架,法律法规和政策制度中的相关条文,审计人员的经验积累。这种思路和方法的特点类似于演绎分析法,是以已有的知识和经验为基础形成分析模型,并将之应用于未知的领域和数据中,推算和分析出符合相关特征和审计需要的结论,我们称为知识驱动分析方法。但另一方面,大数据技术的发展为以归纳分析为特征的思路和方法带来了发展契机,即以数据为中心,采取查询、统计、多维和挖掘等方法,提取隐含在其中、事先无法预知和有价值的信息和知识,我们称为数据驱动分析方法。

      数据驱动分析方法的特点和应用前景

      金融领域大数据具有数据量大、结构复杂多样、连续快速积累和蕴含价值高的特点,采取数据驱动分析方法将提高金融数据分析的客观性、主动性和适应性,主要表现在:一是针对信息维度较为丰富的金融数据,采取数据驱动的分析方法可以有效降低审计数据分析中主观推测的成分,实现“让数据说话”的目标。二是金融数据规模和复杂度的爆发式增长使审计人员的知识学习和经验积累处于被动地位,因此,利用数据驱动的分析技术从数据中“挖掘”知识、积累经验、拓展审计分析方法和模型,是审计人员掌握数据分析和提升知识学习主动性的一条重要途径。三是在数据驱动分析方法擅长的审计对象行为模式和关系特征分析中,异常和噪音数据的影响可以通过分散验证、模型调优等方法将其影响降到最低。

      数据驱动分析方法的技术要点

      (一)以数据为中心直接分析和解释问题

      在商业领域,大数据分析主要应用于对个体的行为模式进行分析和预测,而在金融审计中利用这些方法有助于发现和分析一些常规经济和金融理论难以直接解释和说明的问题。洗钱犯罪是金融领域的常见犯罪行为,广泛涉及逃税、资本套利、腐败资金转移、涉恐资金流动等问题,相关背景和问题性质都非常复杂,如果直接利用上述领域的专业知识去发现和分析洗钱案件,常常比较困难,而且对分析人员在相关领域的专业素质要求较高。在金融审计中,利用资金流水、结售汇、跨境人民币支付等数据,根据洗钱过程中资金流动的特征,如资金划转频繁、交易金额重复多、账户沉淀资金少、公转私交易多、电子交易多等,建立洗钱数据分析模型,能够迅速从金融数据中批量发现洗钱的问题线索,再结合洗钱主体的其他特征,可从中分析查找出各种违规问题和犯罪行为。

      (二)取长补短多渠道选取数据

      在大数据环境中,采用数据驱动的分析方法对不同来源甚至异构的数据进行综合分析,既可以提高数据分析的综合性,也能够较好地弥补单一数据来源信息不足的问题。在一些跨金融领域问题的审计中,在对特定领域数据掌握不足的情况下可以寻找“替补”数据间接解决问题。如在对股票市场“老鼠仓”问题的审计中,最直接的分析方法是将作为“个人”股东和“基金”股东的股票交易数据进行关联分析,按照买入时间的匹配情况分析个人与基金操作的同步程度,从而判断是否存在“老鼠仓”的问题。但在“基金”股东的交易数据无法直接取得的情况下,从商业银行取得基金托管账户的交易明细,适当处理以后进行替代分析,也是一种较好的补充手段。

      (三)结合审计目标灵活使用分析技术

      数据驱动分析方法不是一种创新“技术”,它是在大数据技术条件下对现有的查询、多维、统计和挖掘等分析技术进行综合应用的思路和方法,审计中应突出以数据为中心,结合具体审计任务灵活、恰当地使用各种分析技术。

      1.查询分析

      查询分析主要是利用SQL结构化查询语言对数据进行计算和分析。在数据验证和分析时,按照单一字段对数据集进行分类汇总能够迅速掌握数据集的集中度情况,从分散的数据中快速筛选出感兴趣的数据并展现出基本的行为特征。如在对个人住房按揭贷款审计中,审计人员按照个人信息进行分类汇总,容易发现一人多贷的异常情况,形成疑似虚假按揭问题的线索。推而广之,还可以按照中介商、楼盘、资金来源等字段汇总分析,延伸到对消费贷款、经营贷款的审计中去。

      2.多维分析

      多维分析是对数据进行多角度、多层次的查询和分析,既能够用于总体分析和评价,还可以用于对一些金融业务行为模式的提炼和刻画。在跟踪资金流向时,多维分析技术也是攻克难关的一条“捷径”。在资金流跟踪过程中,当遇到资金被提现时,追踪工作往往难以进行下去。直接解决这个问题并不轻松,在特定情境下,如果反过来直接对提现的交易数据进行多维分析,分析的维度包括时间、地点、人员、渠道和金额等,发现的异常交易可以作为一些重大问题的审计线索;对存现行为也可以进行同样的分析。最后将两者的分析结果放到一起进行匹配分析,揭示出利用现金交易规避监管的问题模型。上述分析方法的灵感来自于对日常生活习惯的捕捉,在技术条件允许的情况下,可以有效应用于海量数据分析中。

      3.统计分析

      在统计分析中,由于引入了统计学方面的知识,分析结论的价值和内涵将更加丰富。一些与具体业务背景不相关的数理统计模型、公式和定理都可以成为良好的数据驱动分析方法。如要准确预测一段时间的资产价格趋势非常困难,但如果对结论的精确性要求不高,把多个历史周期中同时段的数据抽取出来进行相关性分析,也能得到相当有价值的结论。查找异常交易是金融审计的重点内容,在大数据条件下,不符合统计规律的“噪音”数据往往也具有较高的审计价值。如利用统计学中的离散度和偏离度模型,从海量的交易数据中筛选出异常交易,通过探究异常背后的原因往往能发现各种难以发现的问题。

相关文章: