数据作为新型生产要素,正伴随着数字中国战略的深入实施成为数字化、网络化、智能化的基础,深刻改变着生产生活方式和社会治理方式。由中国人民大学主办的2023年“中国电子文件管理论坛”的主题为“面向数字中国战略的档案数据创新与发展”,精准抓住了数据时代档案管理的核心主题。数据是档案资源体系的重要组成部分,数据态档案是档案资源对象演化在数据时代的新形态,具有信号和语义双重离散的核心特征。在国家政策肯定、信息技术赋能和业务数据驱动的多重动力之下,数据态档案在业已形成的数据环境中产生并培育。数据态档案体量指数级增长、类型不断丰富,为档案事业提供新发展机遇的同时,也对前一阶段逐渐探索完善的电子文件归档和电子档案管理模式提出挑战。不同于实体档案对象的序化载体管理、数字档案对象的可信内容管理,数据态档案对象面对的是数据理解与复用、业务逻辑与规则表达、语义整合与复现等新问题,需要与之匹配的数据态档案管理模式提供新的解决方案。基于此背景,本文从管理模式的维度对数据态档案的管理与维护展开探索,以充分挖掘并发挥数据态档案在数智时代的多元价值,构筑起凝结过去、基于当下、面向将来的档案信息化完整发展空间。 一、研究背景 数据态档案是在新一代信息技术条件下以数据形式存在的新型档案形态,具有信号和语义双重离散的核心特征。相较于纸质档案管理所强调的载体管理、电子档案管理所强调的文件管控,数据态档案管理在归档、管理和长期保存等核心业务环节都表现出极大的差异性。这种档案资源形态演变所呈现出的新样态,同样反映在政策法规的规制与理论研究的探索方面。 档案领域相关政策法规以积极融入国家大数据战略为导向,开始重点探索数据与档案协同以及数据归档等问题。《“十四五”全国档案事业发展规划》要求“实现对国家和社会具有长久保存价值的数据归口各级各类档案馆集中管理”以及“大力推动科学数据与科研档案协同管理”。地方档案部门如浙江省档案局形成了《政务服务网电子文件归档数据规范》,对政务服务网电子文件归档过程中存档信息包的数据结构、命名规则和材料形成整理要求等进行了规定,嘉兴市档案馆更是探索形成了《嘉兴市市级机关政务业务系统数据归档暂行标准》。 理论研究在法规政策引导、档案部门响应、学界研究推动下,其研究已初具规模。笔者在2018年率先提出了包括模拟态、数字态和数据态的“三态”演化的观点,明确用“数据态”指代数据档案空间。此后代表学者如赵生辉认为档案与数据分属信息世界和机器世界,二者存在着相互依赖的双轨共生关系[1];陈永生强调由电子数据条目构成的电子档案是真正意义上的原生性电子档案,其信息内容富语义化和价值增强,但也易于失去解析情境[2];金波认为档案数据颗粒度细化,开发方式属于内容控制,其数据价值是档案在数据时代的价值新发现[3];刘越男指出数据治理是大数据时代档案管理的新职能,档案管理分担历史性业务数据和文化记忆数据的治理,以文档和内容管理为立足点[4];赵跃提出档案科学介入数据资源管理的档案化模式,变控制为干预,实现数据资源的档案化认同和数据资源管理过程的“档案化”转变[5]。可见,数据态档案研究在概念认知、核心内容、业务与规则等方面均取得了一定进展。 但档案学研究的“数据热”中,缺少针对普遍问题与困境展开的通用管理体系构建,对数据态档案管理模式的系统研究基本空白,这种只见树木不见森林的研究态势容易导致对这一新生对象的探讨流于片面,不利于从整体对数据态档案本质进行把握,从而阻碍空间整体管理能力形成。为有效管理数据态档案,充分挖掘并发挥数据态档案在数智时代的多元价值,亟须探索适应数据态环境的档案管理新模式。 二、数据态档案管理模式概念内涵 数据态档案管理模式的研究尚处于起步阶段,但可以确定的是其相关研究必须坚持以数据态对象本质特征为核心,应包含从全局角度对数据态档案对象管理的理论重塑,以及对这一新型档案对象核心业务的实践重构。 (一)数据态档案管理模式是基于数据本质的理论重塑 笔者在前序研究使用档案管理对象空间概念来涵盖特定态别档案资源特质及其相应技术体系、管理环境、适用规范等要素[6],并在2023年“中国电子文件管理论坛”中以“档案资源连续空间演化图景分析”为主题,对管理空间的概念进行了较为完整的阐释。不同态别资源空间之间存在发展的连续性和动态的转换关系,数据态在连续空间中既是模拟态和数字态空间转换的结果,也是知识态和价值态空间演化的基础,具有承上启下的枢纽作用。但资源管理对象空间概念偏重于宏观与整体表达,旨在汲取空间立体性、综合性、动态性和连续性的精义,其相对抽象的表述不能与诸要素组成的管理情境直接联系。因而本文提出将相应态别的档案管理模式作为空间表达的具体化形式,在与具体工作衔接时更能体现出特定态别对象的管理程序、方法、结构等核心内容。 数据态档案管理模式是数据态空间在管理环境中的具象化,是该空间范畴内相关理论、规范和业务规则的综合。数据态档案管理模式立足于档案对象信号与语义双离散的特点,从理论层面回应如何重构离散数据语义的核心问题。数据态档案对象离散的特点为信息对象的连续理解带来困难,但其离散的颗粒度形式同时也为多视角、多维度、多层次的数据叙事和数据价值开发提供了崭新的空间。为此,数据态档案管理模式应开展细致的理论重塑工作,要对维系数据语义连续、管控数据之间关联与结构的方法进行研究,并在此基础上对受其影响而发生变化的业务流程和规范进行更新再造。例如,在将关系数据库转换为XML文件进行归档保存时,利用XML处理工具或编程语言,根据数据库中的外键约束,将数据模型中的对象进行关联,建立表与表之间、表与主键之间的关联关系,或者将存储过程与相关的表进行关联。这种关联使得XML文档能够清晰地反映数据库中的结构和关系,为后续的数据存储、查询和处理提供便利。数据态管理模式需要将此类关联方法抽象为数据关联的恢复和固化,并将其嵌入业务流程和管理系统中。[7]