加强面向大数据的审计数据中心建设

作者简介:
杭州市审计局课题组,课题负责人:王丁贵;课题组成员:金伟东,左鼎(执笔),董永明

原文出处:
浙江审计

内容提要:


期刊代号:V3
分类名称:审计文摘
复印期号:2016 年 03 期

关 键 词:

字号:

      一、面向大数据的审计数据中心建设

      数据中心是指将数据经过统一的数据定义与规范命名、实现集中存储,从而达到数据共享与利用的数据环境。随着国家审计进人大数据时代,审计对数据集中的要求也越来越高,传统审计数据中心已经不能完全满足审计应用的需要,建设和发展面向大数据的审计数据中心成为一种必然。

      (一)面向大数据的审计数据中心建设目标

      一是构建一个稳定可靠、可以拓展并且低耗的服务运维环境,为审计数据的存储和利用提供有效的硬件支持;

      二是构建一个容量大、效率高、目录结构合理的存储体系,并对当前零散审计数据资料进行归档整理,保证数据的整体性和安全性;

      三是部署高效、实用的大数据采集软件和分析软件,支持多种数据结构的采集,支持对大数据集的深入、宏观的查询与分析,发挥审计的参谋性和建设性作用;

      四是构建可靠的安全防护系统和数据容灾备份系统。

      (二)面向大数据的审计数据中心系统架构

      以云存储、云计算为基础建设的审计数据中心的体系构架主要包括了硬件层、虚拟层、数据层和应用层,虚拟层是有效保障数据中心正常运转以及服务的核心。此外,安全防护系统和容灾备份系统贯彻整个数据中心的各个层级,与硬件层、虚拟层、数据层和应用层一起组成了面向大数据的审计数据中心。

      硬件层。硬件层是审计数据中心的基础,主要包括了服务器群、磁盘阵列机房环境以及带宽资源,主要是交换机与硬件之类的网络设备,该层被视为数据中心的基础骨架,能够有效降低硬件的成本。

      

      虚拟层。虚拟层是一个虚拟化的环境,它是云计算数据中心的基础设备层。虚拟层的存在会将硬件层的基础设备硬件系统,如存储、网络设备及服务器等全部进行虚拟化,从而建立一个共享的、按需分配的基础资源设备,分布式的数据存储系统的存在是为了能够应用于海量的数据存储以及访问。

      数据层。数据层囊括了审计机关开展审计业务和综合管理涉及的全部数据,包括结构化数据和非结构化数据。按照数据的具体内容和用途,可以把数据层划分为原始数据区、审计管理数据区、交互共享数据区、行业数据区以及指挥决策数据区。各数据区的数据存储于虚拟层的云平台上,支持处于其上的云应用程序。

      应用层。应用层被称为审计数据中心的操作层,是为审计人员开展审计业务和综合管理提供各种专门应用,根据审计人员的不同需求提供与之相应的服务。

      二、杭州审计数据中心的建设构想

      从2003年开始,杭州市审计局建成了“财政联网审计应用系统”等一批拥有自主知识产权的审计信息化建设成果,十多年来为提升审计监督能力提供了强有力的保障。然而随着审计大数据时代的到来,各信息系统的数据间不能比对分析的数据壁垒问题日益突出,原有硬件系统存储空间小和运算速度慢的特点也在一定程度上阻碍了审计信息化工作的推进。

      如何建设一个满足大数据审计的地市级审计数据中心成为当务之急。审计数据中心的建设是一个复杂的系统工程,笔者结合大数据审计的需求和杭州审计信息化建设的现状,重点对地市级审计数据中心的平台建设、数据仓库建设、安全防护体系建设提出了一些设想。

      (一)地市级审计数据中心的基础平台建设

      杭州市审计局已有的审计业务和审计管理电子数据达到了10TB,考虑到审计信息化工作的发展需求,建设审计数据中心存储容量的近期规划在200TB左右,远期规划达到1PB左右,还要根据数据规模配备相应参数规格处理器和内存。

      为便于管理,适应系统分步建设需要,提高系统稳定性,每一个专业审计的数据分析软件使用一台应用服务器。数据量相对较小、访问不频繁的专业审计的数据分析软件,可通过虚拟化技术合并使用数据库服务器。数据量大、访问频繁的专业审计的数据分析软件,使用独立的数据库服务器,如果该服务器仍难以承受访问压力时,可从其他数据库服务器划拨资源。根据审计署审计数据中心系统规划要求,由于数据中心对数据存储和分析性能要求高,因此对数据分析服务器、存储等硬件设备的参数要求偏高,以服务器和存储设备为例,国家审计数据中心选用的数据库服务器CPU为4路6核,内存64GB,4块146GB SAS硬盘;应用服务器CPU为2路4核,内存8GB,4块146GBSAS硬盘。国家审计数据中心存储设备选用华为磁盘阵列,初次配置磁盘有效容量60TB。结构化数据采用FC盘进行存储,非结构化数据采用SATA盘进行存储,该磁盘阵列同时支持上述两种类型的磁盘。按照此标准,要建设200TB存储容量的审计数据中心,系统硬件和机房环境的投入较大,地方审计机关很难承担前期建设投入和后期运维成本。

      

      杭州市政府早在2013年就建设了政府云平台,杭州政府云平台相当于审计数据中心系统架构中的硬件层和虚拟层。杭州政务云平台底层以阿里云先进的飞天架构为基础,单个集群可以为杭州市政府提供约25000核CPU、55000G内存、4000TB硬盘存储容量的服务能力。如果将大数据审计数据中心建设在政务云平台上,一是可以有效降低前期投入成本;二是云平台良好的运维环境可以提高系统运行的稳定性;三是便于从其他部署在云平台上的行业、部门获取审计数据;四是后期系统扩展只需要通过申请云计算CPU资源和存储空间即可,便于操作。

相关文章: