一、大数据概述 大数据(Big Data)是指巨量的、难以用现有常规的数据库管理技术和工具处理的数据集。它具有四个特点:一是数据体量巨大,从GB级别跃升到TB、ZB级别。二是数据类型繁多。三是数据时效性强。四是对数据准确性要求较高。大数据技术就是要以经济的方式快速捕获、发现和分析技术,从各种超大规模的数据中提取、挖掘有价值的信息。2008年,英国《自然》杂志曾出版专刊指出,倘若能够更有效地组织和使用大数据,人类将有更多的机会发挥科学技术对社会发展的巨大推动作用。大数据直接影响国家和社会稳定,是关系国家安全的战略性问题,它既是一个国家数字主权的体现,也是现有产业升级与新产业诞生的重要推动力。2012年3月,美国联邦政府宣布投资2亿美元启动大数据研究和发展计划,用于研发科学探索、环境和生物医学、教育和国家安全等重大领域和行业所亟需的大数据处理技术和工具。同年,我国科技部“十二五”国家科技计划信息技术领域2013年度备选项目征集指南也把大数据研究列在首位。 二、大数据与可扩展商业报告语言(XBRL) 以XBRL为核心的会计信息化标准建设,将企业会计准则对财务报告的披露要求转化为计算机能够处理的代码,实现会计专业标准与信息技术的深度融合,以应对大数据时代会计信息化要求。XBRL技术通过识别、分析、比较、汇总等功能,把单一信息整合为系统信息,把非结构性信息转换为统一可比的信息,把多次录入信息改进为一次性编报信息,提升了信息的集成度和共享力。近年来,XBRL在金融企业、中央企业逐步运用推广,从2012年9月开始,18家商业银行按照通用分类标准编制其2011年度XBRL格式财务报告;保险业也进一步整合保险监管的信息系统,提高数据交换分析效率和保险监管信息化水平。 深度挖掘会计信息资源的价值,对于提升审计机关的能力和效率具有重大的促进作用。当中央企业、国有金融机构等被审计单位广泛应用XBRL后,通过XBRL技术重塑了业务流程、管理模式,整合了财务、业务及管理的各类数据资源,XBRL技术还提供了强大的数据查询、信息分析功能,审计机关面临的审计环境将发生重大变革。近年来,审计机关通过借助兼容XBRL的应用软件对被审计单位的数据资源进行全方位、多维度的深入挖掘和分析,快速提取有效的审计信息,大幅度提升了审计效率,及时发现被审计单位内部控制、管理制度、业务运行方面存在的薄弱环节,提出加强制度约束、防范资金风险、堵塞资产流失等合理化建议,充分发挥了审计“免疫系统”功能。 三、大数据与财政审计 在财政审计领域,审计机关面临的数据越来越复杂和庞大。比如,在推进国库集中支付制度改革过程中,随着电子化、网络化、信息化操作取代传统的手工操作,国库管理信息系统、中央集中支付系统和中央非税收入收缴管理系统等平台,集中了巨量的数据。财税库银横向联网、公务卡改革等工作,在增强信息共享程度的同时,也产生大容量、不同类型和结构的数据。审计机关只有加强对大数据的研究,提高驾驭大数据的能力,才能完善财政审计的动态监督机制,通过对疑点信息监控预警,强化预算执行的事中审计,确保违规问题能够得到及时纠正,并对预算执行情况和宏观经济形势作出更及时、准确的分析和判断,实现审计监督机制的重大变革。近年来,审计署建立了国家审计数据中心,搭建了国税、财政、海关等专业审计领域的数据库框架和数据仓库,逐步建设了一批审计数据规划和审计方法体系,开展在线审计为特征的中央部门预算执行等联网审计工作,进行多维数据分析、数据挖掘分析、宏观决策分析,提高了审计工作的质量和水平。2011年3月至5月,审计署统一组织全国各级审计机关对全国地方政府性债务情况进行全面审计,涉及25590个政府部门和机构、6576个融资平台公司、42603个经费补助事业单位、2420个公用事业单位、9038个其他单位、373805个项目,共1873683笔债务,审计过程中通过建立庞大的审计基础数据库和地方政府债务审计的专用模型,并对这些模型进行数据分析,为最终上报全国人大、国务院的审计报告起到重要的支撑作用。 四、大数据与金融审计 在金融审计领域,金融分析和挖掘是重要的审计工具。在大数据时代,关注金融企业和资本市场的异动,防范金融风险隐患,需要以大数据作为基础保障。从长远看,随着数据化和网络化的全面深入发展,金融服务将向虚拟化方向发展,从而全面颠覆金融服务形态。一是产品的虚拟化,资金流将越来越多地体现为数据信号的交换。二是服务的虚拟化,金融机构将通过完全虚拟的渠道向客户提供业务服务。三是流程的虚拟化,业务流程中各类单据、凭证等将以数字文件的形式出现。在这样的服务形态下,金融机构的整体运作就像一个数据洪流。因此,金融审计的理念和方式也要随之跟进。金融审计只有驾驭了大数据,才能进行全面而深入的分析挖掘,才能在海量数据中迅速、准确地发现疑点,更好地揭露和纠正金融领域违法违规行为,促进稳定金融秩序、防范化解金融风险。近年来,审计署在对国有金融机构审计中,针对商业银行数据大集中的管理模式,建立审计数据平台,集中了商业银行的巨量数据,并对数据进行集中分析。审计中运用了编写结构化查询语言等查询分析技术、统计分析技术,切片、钻取等多维分析技术以及挖掘分析技术等,探索了信息化条件下实行金融审计“总体分析,发现疑点,分散核查,系统研究”的工作思路,有效揭示金融领域的系统性风险,发现和查处金融领域违法违规行为,提升了审计工作效能。