R语言大数据审计可视化运用分析与发展探讨

作 者:

作者简介:
王文婕,长江大学经济与管理学院,硕士研究生在读,主要研究方向为大数据审计、公司财务;康玉梅,长江大学经济与管理学院,博士研究生,副教授,主要研究方向为公司财务、审计。

原文出处:
财务管理研究

内容提要:

02


期刊代号:V3
分类名称:审计文摘
复印期号:2022 年 10 期

关 键 词:

字号:

      0 引言

      数据是新时代重要的生产要素,数字经济的发展对我国工业经济向数字经济转型至关重要。我国“十四五”规划提出,用数字畅通“大循环”、融通“双循环”,为数据产业明确了发展方向。大数据、5G、云计算、人工智能、区块链等新技术飞速发展,使新时代、新发展阶段下的大数据审计具备了技术先决条件。大数据技术对财务数据的辅助分析和可视化已经与审计业务密不可分,本福特定律在审计业务中的运用更确立了数据分析技术在审计进程中的重要地位。随着数据分析技术的发展,现在的大数据审计运用R语言和Python较为广泛,技术开发不再局限于对财务数据进行函数辅助分析,其在可视化编程领域也逐渐活跃起来。R语言适用于哪些领域?在大数据审计中拥有哪些优势,面临何种困境?在审计实务中如何运用?探讨解决R语言大数据审计的运用困境,对数字经济时代审计转型与发展具有重要意义。

      本文通过回顾R语言大数据可视化审计的国内外文献,分析R语言大数据审计可视化运用领域,具体探讨大数据审计的优势与困境,并以北京泡泡玛特文化创意公司(以下简称“泡泡玛特”)为例,运用RStudio工具进行大数据审计分析,用以展现R语言在审计实操中的灵活运用,以期对R语言大数据审计未来发展提出合理性建议并进行展望。

      1 理论回顾与研究评述

      随着金融科技的广泛应用和快速发展,国内常见的CAATs(Computer Assisted Audit Techniques,计算机辅助审计技术)工具主要有Microsoft Office、ACL、IDEA、Microsoft SQL Server、MySQL、Oracle等,数据分析则多依赖MATLAB、SAS、R语言等。R语言大数据可视化审计的理论与运用成为国内外学者研究的新热点,无论是在政府审计、社会审计中还是在内部审计中,计算机辅助技术都得到了相应的重视,其作用也得到了发挥。牛艳芳等指出,政府审计中SQL和OA运用较多:社会审计主要运用账套审计的软件和Excel;内部审计则差异较大,实力较强的企业在ERP(企业资源计划)中嵌入内部审计模块或开发专门的审计分析平台,实力较弱的企业比较依赖Excel。陈伟等认为,目前常用的信息系统(信息科技)审计方法不能很好地满足金融科技应用系统风险审计的需要,继而采用大数据审计技术开展金融科技风险审计,发现大数据审计技术是一种有效的审计方法。刘国城等结合云计算相关技术,运用较为成熟的Hadoop系统,尝试建立审计全覆盖驱动下的大数据审计平台,并从大数据审计平台构建的需求、理念和策略3个方面进行分析,将大数据审计平台分为数据中心、采集、预处理、分析和可视化5个系统,以此探索有效的审计新路径和新方法,为审计全覆盖提供技术基础,并为未来大数据审计工作的开展提供理论支持。宋铁波等也探索了R语言、Python等技术工具的处理过程、优点和缺点。陈伟和詹明惠进一步以金融科技贷款业务系统为例,提出了基于大数据可视化技术的信息系统AC审计方法,并采用R语言实现了该方法,结合案例详细地分析了该方法的应用,从而验证了该方法的可行性与有效性。栾心勇等以山东省各级审计机关为研究对象,了解审计大数据建设及应用情况,在体制、机制、方法和创新技术方面采取的相关措施,以及在人才队伍建设和数据安全方面的保障手段,针对大数据审计思维欠缺、大数据产生新的安全隐患与风险、审计管理模式亟须改善等问题,提出改良审计组织方式、改进数据管理模式、加强培训和实践应用等针对性的解决方案。王茜一则研究了公立医院绩效审计对图形、图像数据审计分析的需求,以医院药品加成绩效审计应用数据可视化技术为研究案例,分析了公立医院是否存在药品加成违规情况。

      王雪荣和侯伟龙采用Citespace对中国知网(CNKI)的2768篇大数据审计领域的研究文章进行可视化分析,认为此阶段学者对大数据适用于审计的情况是基本肯定的,大数据审计技术可以提高审计效率,增强审计质量,节约审计资源,充分发挥审计的监督职能,做到审计全覆盖,但是该阶段的研究还停留在理论层面,对于大数据审计技术实务层面的探讨和应用方面的研究成果存在不足。王海洪等通过综述研究分析认为,大数据技术为审计工作的发展提供了新思路和新途径,大数据审计的规范化值得继续研究,区块链等技术为大数据审计工作提供更多可能。Espinoza和Novoa-Munoz通过世界卫生组织酒精使用障碍鉴定测试智利版(审计)证明序数α的有用性,并以R语言提供用于执行相应计算的命令。

      近年来,随着机器语言的进步,数据收集加速,大数据审计的运用前景得到国内外众多学者的认同。不少学者与企业合作或进行案例调研,以R语言的特性为导向,展现了其在审计实际案例中的强大功能。由此可见,R语言大数据审计具有可实施性,但由于该领域的研究处于起步阶段,审计流程的具体设计与实务还需要更多探讨与挖掘。本文结合案例为该领域研究提供更多审计视角,并为R语言大数据审计发展困境提供解决思路。

      2 R语言大数据可视化运用领域分析

      2.1 R语言大数据可视化基于语言特征的运用领域

      R语言因其简洁、灵活、开源的特性,具备处理TB、PB级数据集的能力,能开自由、有效地用于统计计算和绘图的语言环境,并在UNIX、Windows及MacOS系统中均可以运行,提供了广泛的统计分析和绘图技术,包括回归分析、时间序列、分类和聚类等建模方法。在数据保存方面,R语言具有良好的处理机制,与其他语言相比,它是彻底面向对象的统计编程语言,与数据库之间有较好的接口,可以编译条件语句、循环语句、自定义递归函数,利用MapReduce模型进行分布式计算,满足TB、PB级的数据处理需求,提高了运行速度和计算效率。R语言还提供丰富的数据挖掘算法程序包,如ggplot2程序包中的可编译图形,带给R语言可视化更多的可能性。大数据可视化技术有助于数据直观分析,因此可视化技术成为大数据应用的重点之一。

      R语言已被应用于数学函数、计量统计、金融财会、生物制药等多个领域。随着R语言的开发,数据的可视化分析快速发展,R语言的可视化功能在学术界和企业界均被灵活应用。在学术界,R语言可视化被用于医疗、环境监测、金融分析、电子技术等众多领域的数据图表制作;在企业界,KPI(关键绩效指标)报表、数据监测、人员监控、体温测量中都有R语言可视化的身影。

相关文章: