为贯彻习总书记在中央审计委员会议上的“坚持科技强审,加强审计信息化建设”的要求,充分调动审计人员主观能动性,探索信息技术在审计工作中的应用途径,挖掘审计工作潜力,切实落实好审计信息化建设,推动审计工作质的飞跃。在此背景下,内部审计人员积极响应工作号召,集思广益,坚持理论与实践相结合,坚持提高质效与守住风险底线相结合,开展此项研究工作。 在互联网金融、移动支付快速发展的带动下,国内银行业不断创新业务种类与业务流程,扩展业务开展的空间,逐渐向着数字化银行转变。同时在强监管及内部控制的态势下,各项业务档案、指标与报告文档种类繁多,形式多样,根据相关资料统计,超过80%的资料文档为非结构化数据,诸如文本、图像、音频等。非结构化数据中包含着大量的有价值信息,而挖掘这些信息又不同于结构化数据的处理方法,传统的数据分析手段受到限制,手工翻阅耗时费力,因此,随着非结构化数据的不断增多,内部审计面临着业务创新发展与内外部控制要求所带来的机遇和挑战,需要研究一个有效的方法实现审计工作的变革。
审计中非结构化数据应用现状 1.审计中非结构化数据类型。在开展银行内部审计工作中,需要调阅被审计机构各类型非结构化的管理文档,文档类型有文本、表格、PDF文件、音频文件等,在银行业非结构化数据类别主要包含全面风险报告、人员变动、内部检查报告、考核管理、公文管理等16类,数据总量多,现有审计模式影响审计工作开展的质量与效率。 2.审计中非结构化数据特点。随着业务类型及交易控制手段的更新,银行内部产生大量、多类型、价值密度低的非结构化数据,这些数据包括行内系统数据、行内文档数据,同时也会购买行外的征信、处罚、拍卖等数据。因此,数据量大,种类繁多,存储空间大是非结构化数据的特点。另外,非结构化数据结构随机,无法使用现有的软件工具提取、存储、搜索、共享、分析和处理,数据结构复杂,分析使用难度高也是它的特点;大量数据处理以及不同数据之间的耦合关联,在海量数据中寻找风险线索,数据价值密度低也是非结构化数据的特点。 3.审计中非结构化数据应用方法。一是银行系统产生的应用日志或系统日志以XML格式保存在数据库表中,日常应用中多以数据库语言LIKE或正则表达式函数模糊查询,数据处理用时较长,精准度不足。二是非结构化电子数据,电子数据主要为WORD、PDF、EXCEL、TXT、图片等,这些数据由被审计机构提供,数据检查以手工翻阅,人脑分析判断各线索之间的关联,检查过程漫长,人力资源投入大。三是非结构化纸质数据,银行工作流程中仍然存在大量纸质档案,如培训签到表、机房巡检表、机房进出登记簿、信贷档案等,现场审计过程中检查纸质档案只能通过人力排查,从大量档案中排查出有价值的风险问题。四是系统中非结构化数据,如报告发文、审批授权等存放在系统中的文件,检查这类文件采用抽样以及观察的方式开展,主要还是人力成本的堆砌。现行非结构化数据审计方法低效、低质,无法实现快速获得有价值的信息,反而增加了审计工作的风险。
审计中非结构化数据应用面临的问题 现行审计工作思路基本为“非现场+现场”,首先通过非现场结构化的数据分析确定工作方向和范围,其次通过现场检查确认问题属性,在文档与音频等资料数量少的情形下是可行的。但是银行业随着信息技术的发展,风控体系管理规则的完善,非结构化数据已成为主流数据类型,已有的非现场技术仅能对部分结构化数据建模分析,大量有价值数据未能有效利用,审计风险不断加大。 1.审计方法与工具的不足。由于非结构化数据具有大量、型多、结构不固定等特点,传统的数据建模、抽样统计、数据透视等方法不再适用,现行广泛使用的数据处理工具SYSBASE、ORACLE、SQL等很难兼容非结构化数据。而随着银行数字化转型,非结构化数据将日益增多,给审计工作带来前所未有的挑战,审计现有的工作模式无法应对大量非结构化数据的增长,单纯人力的检查势必会延长项目周期,审计工作效益无法保证。 2.审计工作无法实现连续。结构化数据可以通过数据建模、脚本监控的方式实现日常风险的监督,较好的保证数据的有效性与风险发现的及时性,实现持续审计监督的职能。但在非结构化数据下,审计人员只能定期或在特定项目中通过人工机械地翻阅资料,且大多是历史数据,数据的时效性差,风险发现存在较大滞后性,审计间隔长,无法实现连续审计。 3.审计资料利用率低。审计工作从结构化数据中发现问题的几率在逐渐减少,大部分有价值的数据潜藏在各种非结构化数据中,而审计项目周期基本在30~90日,通过人工翻阅大量的非结构化数据是无法保证完全覆盖的,真实操作中是按比例抽取一定数据检查,审计资料利用率低,发现问题缺乏代表性,更难揭露整体风险。 4.审计风险不断升高。由于审计工作在非结构化数据中存在缺少方法与工具、无法实现连续审计以及审计资料利用率低的问题,导致现行审计工作仅能发现部分风险问题,更甚有可能通过片面的线索得出不适当的结论,错误性的指导,误导了工作的开展。审计的不彻底性与片面性,使得审计工作的风险日益增加,随着审计项目的不断开展,审计风险累积数也随之升高,需要通过有效手段处理非结构化数据,控制审计风险的上升。 综上所述,非结构化数据的大量增长,而审计工具与工作模式未紧跟更新,非结构化数据挖掘与应用成果不显著,应用于审计工作中的成果更加不足,以至于造成审计工作当前的困局。非结构化数据的处理、分析及应用的能力并未能与它的增长速度相适应,与结构化数据的研究和应用能力更是相差甚多,因此提高非结构化数据的分析和应用能力,加快在审计工作中落地,解除审计当前的工作困局,已经成为一件非常必要且有重要意义工作。