审计大数据的提出、特征及挑战

作者简介:
吕天阳,审计署计算机技术中心,博士;杨蕴毅,审计署计算机技术中心;邱玉慧,国际关系学院公共管理系,副教授。

原文出处:
财会月刊

内容提要:

02


期刊代号:V3
分类名称:审计文摘
复印期号:2018 年 05 期

关 键 词:

字号:

      近年来,我国出台的一系列文件表明:审计监督已成为行政监督体系中八个独立的组成部分之一,其职能已基本扩大到了国家治理的全领域(刘家义,2015),并要求实现审计监督的全覆盖。与此同时,审计对象在大数据时代所产生的数据量日益庞大,其违规行为日趋隐蔽,国家审计所关注的体制机制性等重大问题也呈现综合性特征。

      审计职能的扩展和审计对象的新变化对现有的审计数据基础和分析方法提出了新的要求。相关文件、审计署领导都指出:应推进以大数据为核心的审计信息化建设,构建大数据审计工作模式,积极开展审计大数据的综合利用。相关领域的学者也认为,大数据有助于实现审计监督全覆盖,数据综合分析可以帮助提升揭示审计问题和风险的深度与广度(秦荣生,2014)。各级审计机关也积极地建立数据分析职能部门或专业分析团队,如我国审计署2015年成立了电子数据审计司。

      但是,仍有一些基础性课题亟待解答。如国家审计需要使用哪些大数据?审计大数据有无自身特色?现有的大数据分析理念和手段能否满足审计需求,尤其是实现审计大数据的综合分析?对此,一些研究或是倾向于将审计大数据等同于大数据,或是试图将大数据分析技术直接应用于审计实践。这些都制约了我们深入理解审计大数据的本质,阻碍了审计技术方法的创新。当前,管理科学和社会科学也在探索、甚至在争论大数据如何服务于社会治理(梁玉成,2014)。但是,现有技术主要针对互联网大数据,极少开展对多个领域政府大数据的综合分析。现有的少量实践也表明,科学的公共管理需要综合利用多领域大数据和互联网等新兴媒体中的社会大数据。

      为此,本文一方面基于学科视野,从运用大数据服务公共治理相关领域的最新进展中汲取有益经验,并在相互比较中辨析审计大数据研究的特点;另一方面立足审计实践,结合国家审计案例和审计调查结果,理清审计大数据诞生的背景和范围,进而探究审计大数据的特征及其带来的挑战。由于整个学术界对于大数据概念的界定及其影响的探讨仍处于争论与发展并存的阶段,对于审计大数据的探讨和实践也必然需要较长的时间才能达成共识,文中观点仅供国家审计研究者和实践者参考。

      二、面向公共管理的大数据研究

      利用大数据支撑国家审计并服务于国家治理,是大数据服务于公共管理的一个子命题。梳理大数据服务公共管理的研究进展,有助于辨析审计大数据的特色,并从中汲取有益的经验。

      1.大数据的特征。近年来,信息技术以前所未有的广度和深度记录了人类社会的方方面面,也对各个领域使用的数据基础、理念和方法产生了重大影响。以信息科学为代表的自然科学学者较早注意到这种变化,提出并倡导大数据的理念。虽然不同学者对大数据的界定有所不同,但是一般都认同大数据应该具备高体量(Volume)、多类型(Variety)、高处理速度(Velocity)和价值密度低(Value)这四种特征中的全部或多数,即4V特征(Victor等,2013)。

      管理科学和社会科学学者也注意到大数据及其分析方法对于公共管理的精细化、科学化的重要意义。有别于以往采用的田野调查、访谈和抽样资料,大数据以更大的范围、更细的粒度描述对象的行为,其采集过程几乎不受霍桑效应的影响(罗玮,2015),这被总结为大数据的第五个特征,即真实性(Veracity)。因此,大数据被认为能够更为全面、客观、真实地描述人类社会的行为。表1总结了相关研究中传统数据与大数据之间的差异。很多学者认为大数据是这些学科数据基础的重大变革,其对于管理和社会科学研究的意义,堪比显微镜对于化学的意义(Vindu Goel,2014)。为此,2009年,15名顶级学者在《Science》杂志发表论文,正式提出了“计算社会科学”(Computational Social Science)这一崭新的研究领域(David Lazer等,2009)。在此之前,我国学者王飞跃(2005)也提出了与之类似的社会计算(Social Computing)的思想。

      

      2.大数据如何服务于公共管理。目前,对于大数据如何服务于公共管理仍处于探索阶段,相关成果集中在舆情分析、卫生、交通等少数领域。一个代表性应用是:Google Flu利用大量用户在Google搜索引擎中输入的检索关键词监测流感的传播情况,该系统已在美国、荷兰等多个国家作为公共卫生管理的重要手段得到实际应用。而以往对流行病的监测主要依赖美国疾病控制和预防中心(CDC)等政府机构收集各个医疗机构的诊疗信息,时效性较差。两相比较,Google Flu在最初运行阶段能够提前两周左右就获得与CDC数据相接近的监测结果,大大提高了流感监测的时效性。

      众多研究者和以Google Flu为代表的系统都较为重视利用互联网大数据服务公共管理,而相对忽视政府部门所掌握的政务大数据。产生这一现象的原因,一方面是此前互联网公司和信息技术人员对互联网大数据开展了大量的研究,形成了较有活力、更为开放和较成熟的技术基础;另一方面,政务大数据的获取较为困难,其实际应用效果和技术分析手段敏感性强,制约了对其的探索。但是,政务大数据对经济运行、社会生活等国家治理问题具有更为重大和直接的影响(鲍静等,2016)。正如李克强总理所指出的,中国政府部门所掌握的大数据占全国数据资源的80%。政务大数据也是我国新近发布的《促进大数据发展行动纲要》关注的焦点之一,并不应当在公共管理中缺席。

相关文章: