全数据视角下的民生审计

作 者:

作者简介:
毛文峰,宣俊,杭州市审计局

原文出处:
浙江审计

内容提要:


期刊代号:V3
分类名称:审计文摘
复印期号:2014 年 08 期

关 键 词:

字号:

      一、数据全覆盖的现实需求

      数据全覆盖的现实需求源于民生审计对象业务全覆盖及数据的高相关性。

      首先,要保证审计范围全覆盖必然涉及社会保障、医疗卫生、食品安全、资源环保、教育、就业、保障房建设等多个领域。民生事项多已经采用信息化管理,业务种类多、业务量大,不可能采用传统的手工审计达到“不留死角”的审计效果。这就要求我们对涉及各审计对象业务数据进行全面采集与分析。

      其次,民生政策复杂性与关联度明显高于其它政策,一项政策可能有多项前置条件,政策与政策之间可能存在多种关系(如互斥关系、传递关系等等),所以对应的业务数据也往往涉及一个职能机构的多个部门以及多个职能机构,孤立的数据往往起不到审计验证与分析的作用。

      基于上述两点,现代化民生审计工作中对数据全覆盖提出了现实需求。

      二、数据全覆盖的配套工程——数据全集成

      在数据全覆盖要求下的信息化审计首先要做到数据全集成。依托审计机关审计数据中心资源,将社会保险、财政地税、房产、公积金、车辆等公共信息与残疾人管理、食品药品监督等专项信息进行全数据有机整合,达到数据互通、数据互查、单入多出的效果,全景多维展现被调查对象的属性信息。数据高度有机融合,在运算技术上可以加快数据处理速度、提高数据运算效率;在审计业务上可以提升审计分析思维的广度和深度。

      (一)格式化同质字段

      为提高数据的一致性与可比性,对不同系统、不同数据表的同质字段的格式应进行统一。举例来说,很多政策均存在享受期限的问题。在不同系统的不同数据表中,享受期限可能是一个字段表示的,也有可能是两个字段表示的;有可能是日期型的字段也有可能是整型字段,为了格式化相同含义的同质字段,享受期限的表示应予以统一。我们的做法是:享受期限的表示统一为两个字段:[起始日期]和[终止日期],均为日期型数据,若无终止日期,终止日期字段表示为空(NULL)。

      (二)建立数据之间的一般联系

      将数据清理及数据入库后的数据表建立统一标识,并对统一标识建立索引。举例来说,一个自然人,在社会保险系统中的身份确定标识为个人编号,在残疾人管理系统中的身份确定标识为残疾证号。在各自系统中,用各自的标识可以关联系统内的数据表。但在跨系统运算中,需要通过中间字段进行关联(比如公民身份号码),造成数据运算复杂度提高,运算耗时成倍甚至千百倍增长。所以需要为相关表加注统一标识字段,增加数据集成度,对应地,增加基本数据标识表,可用于连接关联各个数据表。

      示例,查询所有重度残疾人托养人员的社会保险参保情况,如果采用原有处理方式,需要三步:1.即将残疾人托养信息与残疾人基本信息进行匹配(匹配字段:残疾人证号),2.将残疾人基本信息与社会保险人员基本信息进行匹配(匹配字段:身份证号),3.将社会保险人员基本信息与社会保险参保信息进行比配(匹配字段:个人编号),详见图1。如果采用集成后的处理方式,将只用一步完成(匹配字段即统一标识:人员标识号),详见图2。

      

      

      同样,对于单位信息数据也需要集成,如单位在税务系统中以企业内码标识,在社会保险系统中以单位编号标识,在某些系统中又以组织机构代码标识。所以,对于单位也需要建立基本数据标识表,建立统一标识。

      三、数据全覆盖视角下的审计业务思路——以残疾人社会保障和服务体系建设专项审计调查为例

      (一)全景式展现对象个体状况

      我们在开展项目的调查过程中,对部分残疾人进行了走访入户调查,为事前对调查对象有所了解,并对个人社会保障情况进行科学评价,我们对部分对象个体进行了全景数据复现。

      步骤一:将调查对象人员的身份证号输入比对系统。

      十五位或十八位的身份证号均可被系统接受,系统将对身份证号进行数据校验,校验成功的,将在基本数据标识表中检索到人员识别号。

      步骤二:程序软件将利用人员识别号关联各数据表,检索相关人员的数据信息。图3为数据查询结果主界面(已做技术处理,隐去部分信息),图4为展开明细后个人社会保险参保明细情况。

      

      

      

      (二)基于各数据关系的全业务审计

相关文章: