审计信息化是审计领域的一场革命。实践证明,金审工程大大推动了我国审计信息化的发展,但由于会计核算软件没有统一的数据接口标准,严重制约了我国金审工程的发展。为了克服数据交换的障碍,提高会计数据的综合利用率,降低社会使用会计信息的成本,促使财务软件市场朝着规范化、正规化和实用化发展,2004年,国家出台了具有里程碑意义的《信息技术:会计核算软件数据接口》(GB/T19581-2004)的国家标准。近期,国家标准化管理委员会即将发布《财经信息技术:会计核算软件数据接口》国家标准(以下简称“国家标准”)。该国家标准对数据元素、输出文件的格式和数据结构等作了详细的规定,为会计核算软件与其他信息系统之间的数据交换创造了条件。 就审计而言,该国家标准一旦执行,不仅会降低过去因没有数据接口而发生的数据转换成本,而且还为会计数据仓库的建立创造了条件。会计数据仓库建成后,审计人员既可以查询被审计单位不同会计期间的会计信息,还可以查阅该行业其他企业的不同会计信息,通过联机分析处理、数据挖掘等技术,大大提高审计效率。而如何根据这一国家标准建立会计数据仓库,如何利用数据挖掘技术开展基于会计数据仓库的审计,是目前理论界和实务界面临的新课题。 基于国家标准的会计数据仓库设计 企业使用通过国家标准认证的会计核算软件后,可以向财政、审计和统计等国家政府机关报送统一格式的电子版会计数据,这就为国家建立会计数据仓库创造了条件。但是,应当由谁来创建会计数据仓库,如何创建,仍有待于我们进一步思考。笔者认为: 国家会计信息中心应当是建立会计数据仓库的管理机构。目前,我国的企业按行政隶属关系分为中央企业、省管企业和县(市)管企业,为此国家可以在中央和地方层面分设会计信息中心,对不同层级的会计数据仓库的建设进行管理。国家会计信息中心负责统筹规划,组织国家和地方会计数据仓库的建设,地方会计数据仓库的建设要接受国家会计信息中心的领导,确保数据仓库结构的一致性。 建立分布式的会计数据仓库,实现各个国家标准的版本兼容。我国地域广阔,各地区发展又不平衡,无法建立集中式的会计数据仓库。国家会计信息中心要建立央企会计数据仓库,地方会计信息中心要建立地方企业会计数据仓库,并实现中央和地方会计数据仓库之间的通信。各级政府机关根据授权使用会计数据仓库。鉴于国家标准可以每两年修订一次,各版本间可能会产生较大的差异,在建立数据仓库时,要考虑不同版本的兼容问题,实现不同版本更多的数据共享,确保进入会计数据仓库的数据质量得到保证。 按行业分类建立会计数据仓库。根据国家标准《国民经济行业分类》(GB/4754)来建立行业数据仓库,并注意行业门类的大、中、小类的划分。以企业集团为例,目前很多企业集团都处于多元化经营格局,这就涉及不同行业的不同类别。在建设数据仓库时,行业、行业类别和企业的法人层级结构是数据仓库的重要维度。比如,中国航空集团公司在国家标准的电子账簿中,其标示符为“010106”,其下属子公司的主业涉及航空客货运运输、旅游和建筑等行业,在建立数据仓库时,其数据存取路径为行业、行业类别、母公司、子公司、子公司所属行业等,按单体企业归集会计数据,同时要考虑母子公司会计数据的勾稽关系。 会计数据仓库数据模型设计。建立会计数据仓库的主要目的是提升审计的效率和效果,但是基于国家标准的数据仓库建设是一个庞大的系统工程,需要从制度。组织层面加以保障,才能建好用好会计数据仓库。为此,本文主要研究会计数据仓库实现过程中的模型设计,这就涉及以下几个方面: 主题域的确定。这是数据仓库设计的关键,整个会计数据仓库都是围绕主题域而组织的。对审计人员而言,会计数据仓库的主题域涉及薪酬文件、固定资产卡片、记账凭证文件、科目余额文件和财务报告等。根据国家标准输出的会计文件,重要的主题域有:一是总账类主题,主要包括总账基础信息、记账凭证、会计科目、科目发生额及余额和会计报表等文件;二是应收应付类主题,主要包括单据类型、交易类型和应收应付明细表等;三是固定资产类主题,主要包括固定资产卡片、固定资产折旧方法、固定资产折旧信息等文件;四是员工薪酬类主题,主要包括员工薪酬项目、薪酬期间和员工薪酬记录及明细等。 概念模型设计。概念模型主要用于设置事实表与维度表之间的链接,使每个维度表通过主键和外键连接,进而实现与事实表的连接。设计概念模型要根据需要,确定数据仓库中的指标实体和纬度实体,以及在实体间的联系。概念模型一般用实体关系图(E-R图)来描述。在会计数据仓库中,主要实体有记账凭证、账簿和财务报表等,这些实体的属性在国家标准中有详细的描述。如记账凭证,规定了记账凭证日期、会计年度、会计期间、记账凭证摘要、借方数量等57个属性。 逻辑模型设计。数据仓库的逻辑模型有星型模型和雪花模型。星型模型是最常用的模型,它通过一个包含主题的事实表和多个包含事实的非正规化描述的维度表来支持各种查询,通过事实表将各个不同的维度表连接起来,各个维度表都连接到中央事实表。维度表中的对象通过事实表与另一个维度表中的对象相关联,每一个维度表通过一个主键与事实表进行连接。建立会计数据仓库,要根据国家标准对事实表和维度表的数据字段进行格式描述。事实表反映了会计数据仓库应用的主题,包含了数据仓库中最重要的信息。粒度设计是事实表设计中的重要一环。一般而言,粒度层级越低,细化程度越高。在会计数据仓库中,粒度层级从高到低是会计报表、科目余额文件和记账凭证等。在设计会计数据仓库的粒度时,以既要满足业务需要,又要减少数据仓库的数据量为原则。维度表主要有行业纬度、记账凭证类型纬度、会计科目纬度和会计期间纬度等。在星型模型下,可以很容易地从维度表中的数据分析开始,获得维度关键字,连接到中心的事实表,实现对会计报表等数据的查询等。