近年来,随着我国大型企业规模不断扩大,企业经营管理数据呈爆发式增长,数据量由GB、TB增长到PB级规模。同时,审计作业模式由传统审计向复合型业务、多数据源关联方向发展。现阶段央企内部审计信息化取得了一定的进展,但内部审计所需信息缺失、审计作业模式单一、高度依赖现场审计作业等问题亟待解决。相比传统审计方式,大数据审计分析的数据范围更广,更方便使用外部数据,时间地点限制也少,针对审计大数据,利用计算机平台把数据分类、数据挖掘、用户画像等先进技术应用于审计作业,能帮助快速发现审计风险和疑点。 本文主要讨论大数据视角下企业审计画像指标构建思路及应用,探索用量化的指标方式进行审计业务的画像构建,帮助审计人员做出判断。用户画像技术最早用于刑侦破案工作,目的是找到嫌疑人的犯罪特征。对企业内部审计而言,将大数据画像技术应用于审计作业,就是根据审计业务需求,从海量的数据里发现审计线索,构建出标签描述对象,进而通过标签、统计、对标、评价等分析手段进行可视化呈现,直观展示审计对象特征,发现疑点,预测风险,帮助企业提高内部审计工作效率,从而辅助提升经营管理水平。 二、画像综述 本文所指的画像,系用户画像(User Profile),是由某一特定群体或对象的多项特征构成的要素集合。计算机输出结果通常是对特征的具体描述,也可把画像理解为由多个标签组合而成的标签集合。审计画像,即在审计作业活动中,将画像技术应用于审计对象,形成对审计对象或审计业务丰富的、立体化的描述过程。 针对用户画像的研究,早期关注对象是“实体的人”或“虚拟的人”,后来扩展到“组织”或“物”等非人的对象。 当画像研究对象是“人”的时候,通过研究单一用户或群体的特征,形成描述问题的标签体系,进而实现用户行为区分、个性化搜索、行为预测的目的。黄文林提出高校精准思政工作的学生画像方法。龚新刚等认为,借助本体建模工具构建用户画像能详细了解每个读者的真实需求。范哲以数字原住民为研究对象,通过访谈法收集用户相关数据,利用亲和图抽取用户行为过程中的阶段性特征并构建多种典型用户画像,根据不同类型用户分析行为与行为变化原因。文素华等提出一种经济责任审计为领导干部精准画像的实现途径。何雪海等设计的网络安全管理系统能实时地判断用户异常行为。 当画像研究对象是“组织”或“物”时,对象的特征融合了业务特征。田娟等讨论了基于大数据平台企业画像标签体系模型和建模框架。赵永柱等开展了基于电力资产全寿命周期的标签画像技术研究,构建多层次、多视角、立体化的资产全寿命周期画像,以实现对电力资产特征的全面刻画。王镂研究了面向企业征信的画像,根据画像用途和企业数据特点,设计了一套适应征信的企业画像体系框架。孙哗等将画像引入到金融监管,提供了一套风险定义、指标提炼、风险预警、风险处置的风险驱动监管闭环应用体系。 三、审计画像构建方法 (一)画像构建思路 本文研究的审计画像基本思路是构建“数据—标签—场景—画像”体系,过程如下:(1)采集企业内外部审计数据,分析数据类型、数据结构、数据年份等并选择可用的数据,编制数据调用接口。内部数据采集自人资、财务、经法、工程、营销、ERP系统等,外部审计数据包括互联网舆情、司法数据、企业征信大数据等。(2)基于数据,通过赋值、统计、数据挖掘等多种形式,形成描述审计对象特征的标签。(3)结合审计画像场景,选择可以充分刻画审计对象的多个分析维度,分别构建标签体系。通常设计为一级标签、二级标签,必要时设计三级,各级标签需定量打分时,要设计出标签对应的权重和打分方式。(4)生成审计画像,并对相关指标的风险进行预警,对重点关注指标进行预测,形成画像分析报告。 审计画像不是一成不变的,它会随审计场景、审计对象、审计年份的变化而变化。画像展现方式包括雷达图、词云、知识图谱、数据分析表等或以多种方式组合展示,如图1所示。
(二)标签体系构建原理 审计人员使用计算机大数据画像平台时,需要完成标签体系构建,主要内容如图2所示。
标签的构建过程按照层级进行,即标签主题+标签维度+具体标签,通过逐层刻画,以实现能描绘对象标签的全貌。标签体系构建包括标签生成、标签存储及标签管理。 (1)标签生成主要是围绕企业、组织、资产、财务、人员等主体展开,从标签的可获取、可量化、可评分、可进行推论等角度出发,结合审计业务场景,选取与之相关的标签描述形成画像指标,如描述企业整体情况,选择财务指标标签、营商环境标签等作为一级标签。当标签指标需要更加细致的描述时,要设计下一级标签,例如财务标签下细化出营业收入、营业利润、资产负债率、偿债率等二级标签。数据标签的确立以审计对象所在地区法律、法规和行业规定为基础,将数据指标从定性分析转为定量分析。(2)标签存储指针对标签类型的差异在存储时要按动态标签、静态标签做必要的区别。(3)标签管理包括对标签的增加、编辑、调用、搜索、删除等标签生命周期内的主要操作。