近年来,全国棚户区改造、旧城区改造的征地拆迁项目数量与日俱增,对征地拆迁补偿资金的审计(简称“征迁审计”)也越来越引起各方面的关注。而征地拆迁项目资金量巨大,且往往仅有纸质文档资料,因此,运用科学的数据归集方式及审计抽样方法,是保证高质量、高效率地完成审计任务的关键。 项目基本情况 2016年12月,根据审计署统一安排,由荆州市审计局组织、沙市区审计局成立审计组,对江陵县2016年保障性安居工程进行审计。2016年,江陵县通过货币化安置方式实施棚户区改造,保障棚户区居民1815户,涉及补偿资金8.63亿元。 本案例中探索运用大数据技术对征地拆迁数据进行采集、分析和整理,形成标准电子数据,建立数据筛选模型,缩小审计查找范围,在此基础上选取科学的取样标准,抽取疑点样本。 建立数据筛选模型 审计组尝试使用大数据技术对征迁资金的总体情况进行把握,对征迁档案进行数据化处理,建立数据筛选模型,对补偿情况进行抽查复核,取得了较好的效果。 搜集相关文档。搜集江陵县保障性安居工程棚改项目相关数据资料,主要是征迁补偿方案、征迁补偿标准、补偿协议、补偿金额计算表、产权证明、户籍证明、财政支付征迁款凭证及领款单等文档。 采集整理标准数据。审计组按照江陵县保障性安居工程棚改项目的划分标准,对棚改项目分成5个片区分别采集标准数据。以拆迁协议为依托,结合补偿金额计算表、产权证明及支付凭据等基础数据,设计《房屋征收补偿统计表》,主要包括序号、片区、征收组、协议编号、被征收人等字段,并对标准表内的每个要素填列提出具体要求,做到格式一致,数据一致,便于后期的数据分析。 数据校验与审核。首先,对从5个片区采集的数据进行有效性、逻辑性核对;其次,将5个片区的数据分别与自查汇报材料上完成的拆迁量与资金量进行核对,关注每个片区是否完整上报;最后,将5个片区数据进行汇总,与从财政部门、城市投资集团采集的征迁拨款及用款进行比较,从总体上把握数据的完整性。 数据分析。将采集汇总的资料导入数据库,编写SQL查询语句,按照补偿金额较大、实际补偿金额超过协议补偿金额较大、实际补偿金额小于协议补偿金额等9个模型选取疑点。 一是补偿金额排名前50的协议。 二是实际补偿金额超过协议补偿金额倍数排名前30名,且比例大于1.1倍。 三是实际补偿金额小于协议补偿金额倍数排名前100名,已经拆除,且未补偿完毕或者签订协议已经超过3个月。 四是协议补偿金额高于预测补偿金额排名前100名。 五是无预测补偿金额且协议或实际补偿大于1万元。 六是关联人员户均补偿标准普遍高于非关联人员。 七是相同片区协议编号相同,被征收人不同。 八是身份证号码相同,被征收入不一致。 九是身份证号码相同,被征收入有多处房产。 数据核查。运用9个数据筛选模型,筛选出370人,412笔样本数据,样本量占总量的20%,占拆迁金额的31%。审计组通过调阅征迁业务档案,查看入户调查表及权属证明,核实拆迁补偿协议及计算表,核对财政资金拨付。关注是否存在未按补偿标准进行补偿、征迁入户调查表及权属证明与权属证明数量不一致、补偿协议与补偿资金不一致等问题疑点。 本案例主要解决的是在征迁项目审计过程中,审计人员在面对大量纸质资料,缺乏运用数据技术进行审计的先决条件下,如何通过规范化的表格全面采集基础数据,解决审计过程中选取样本过于随机的不科学性和无法从总体上掌握资金动态的局限性,增强取样的科学性、规划性及一致性,明显提高审计效率,得到了上级审计部门的一致认可。