身份证号码在审计数据分析中的应用

作 者:
赵新 

作者简介:
赵新,河南省三门峡市陕州区审计局

原文出处:
中国审计

内容提要:

02


期刊代号:V3
分类名称:审计文摘
复印期号:2017 年 01 期

关 键 词:

字号:

      近年来,审计机关积极探索大数据审计,在重点民生资金项目审计,特别是精准扶贫审计中,运用现代信息技术,综合比对财政供养人员、工商登记、税款缴纳及车辆登记、房屋登记等数据,清理了大量不符合条件标准的人员。之所以能准确筛选出不符合条件的人员,除了有大数据技术的支撑,关键是有准确唯一的身份证将各类数据有机联系在一起,为横向比对数据提供了纽带。

      身份证号码的构成

      我国现在使用的是第二代居民身份证,由18位数字构成。身份证号码属于特征组合码,由17位数字本体码和1位数字校验码组成,排列顺序从左至右依次为:6位数字地址码,8位数字出生日期码,3位数字顺序码和1位数字校验码(如图)。

      

      通过对身份证号码构成的解析,身份证号码的运用主要存在两个层次:一是从身份证号码中提取信息,验证真伪;二是以身份证号码为关联,与财政、工商、税收、房屋、车辆等信息横向比对,验证申请人的条件是否合规。同其他审计数据一样,身份证号码要经过数据的归集、整理、加工、验证等几个环节,才能真正用于分析应用。

      身份证号码在审计中的运用

      (一)归集身份信息

      在数据整理过程中,审计人员应注意保证身份信息的完整性、准确性,避免在整理过程中引入新的错误。如身份证号码必须以文本方式存储在Excel等电子表格中,否则Excel会误将身份证号码作为数字以科学计数法的形式存储,或是对最后几位进行四舍五入,导致身份证号码位数的丢失,造成信息失真。为避免这种情况发生,通常的做法是,在将不同身份证信息汇总于一张Excel表时,先将整张空表的数据格式设置为文本,然后以无格式的方式选择性粘贴。或者,先将身份证号码列粘贴到新建的文本文件中,然后新建一列再粘贴回来。在单个录入身份证号码时,可先在单元格中录入一个英文状态的单引号,然后再输入身份证号码。

      (二)统计身份证号码的长度

      为保证后续分析的顺利进行,提高分析的准确性,在利用身份证号码开展分析前,需要对身份证号码进行初步验证,主要从身份证号码的长度入手。

      通常情况下,身份证号码只有15位和18位两个长度是合法的,但在数据的录入、传递、归集、整理等过程中,会因人为录入错误、设备传输错误、软件批量处理添加空格等原因,导致出现各种长度的身份证号码。所以,需要对身份证号码的长度做出分类统计,从宏观层面对身份证号码有一个了解。在SQL Server数据中,可以使用SQL语句统计身份证号码长度的种类及数量,然后逐个分析。身份证号码长度存在问题,要么是身份证号码前后有空格或是其他不可见字符,要么是录入错误,少录或多录,要么是15位身份证号码。对空格等不可见字符,可以批量替换掉;对确定位数既不是15位又不是18位的,要单独列出,与原件进行核对;对15位的,根据工作需要可以转换为18位长度。

      (三)将15位身份证号码转换为18位

      通过前面对身份证号码构成的分析,可知18位身份证号码相对于15位身份证号码,一是出生日期用八位完全表示法,二是增加了校验码。在转换时,首先在15位身份证号码的出生日期前添加“19”以补全年份,然后计算校验码。

      (四)身份证号码验证方法的适用范围

      从技术层面看,身份证号码真伪的验证方法有两类,一是分析身份证号码的构成,这是本文分析的重点。二是通过全国公民身份证号码查询服务中心验证。在审计工作中,特别是对于基层审计机关,应用身份证号码验证方法开展审计,主要集中在保障性住房申请、农村危房改造申请、低保申请和就业培训等民生领域。被审计单位对申请人员的信息管理往往没有统一的信息平台,数据通常是基层录入、层层汇总、手工管理,数据量不会很大,但数据在手工层层传递汇总过程中容易出现各种错误。

      综合考虑审计成本和效益,建议对于没有特殊要求的一般审计项目,采用第一类验证方法即可;对数据量很大,或是对身份信息认证要求严格的项目,可以考虑与全国公民身份证号码查询服务中心合作。在对被审计单位比较大型或重要的信息管理系统进行审计时,可以建议被审计单位与全国公民身份证号码查询服务中心合作,将认证服务嵌入其业务系统中。

      (五)验证身份证号码的真伪

      通过归集、整理、验证等过程,可以编写函数,提取标准18位身份证号码的地区、年龄、性别等信息,可以重新计算身份证校验码,通过与已有信息的对比,可以基本验证身份证号码的真伪。

      这里说基本验证了身份证号码的真伪,是因为仅从身份证号码的构成上进行分析,可以发现并排除不合法的身份信息,但不能保证其他身份信息就是真实合法的。因为公民身份证号码的构成标准是公开的,不排除有造假者接身份证号码的构成标准伪造身份证号码。

      要进一步验证身份证信息的真实性、合法性,确定某个身份证号码不仅构成合法,而且确为公安部门登记核发的,可以到全国公民身份证号码查询服务中心的官方网站进行查证。该中心是公安部的下属单位,专门负责建设管理和运营全国公民身份信息系统,为政府部门及社会各界提供全国公民身份信息服务。该中心提供身份证号码解读、15位升18位及身份信息认证等服务。用户除了可以通过互联网Web方式来获得服务外,还可以通过WebService接口方式,将认证服务嵌入用户业务系统中,实现实时、批量认证,以提高工作效率。通过该中心官网了解到,已有很多信息系统,特别是金融、通信、保险等行业已将此服务融入自身系统中。

相关文章: