档案资源体系建设是档案事业的基石,因而也是我国档案事业的政策部署和实践开展的关键内容。随着信息化工作的推进,档案资源体系建设不断推进数字化转型。首部全国档案信息化工作专项规划《全国档案信息化建设实施纲要》将“目录数据库建设”“机读目录移交”“档案全文数据库和多媒体数据库建设”“电子文件归档”“电子档案接收、保管、利用”“档案数字化”作为信息化背景下档案资源建设的主要任务。[1]这奠定了数字时代档案资源体系建设的基本格局,即将数字形式的档案原文、档案目录及其数据库作为建设对象,将移交接收、保管利用作为建设环节。随着“利用体系”概念的兴起,利用逐渐从档案资源体系建设任务中剥离,收集保管成为其核心内容,“存量数字化”和“增量电子化”成为数字档案资源建设的代表性表述。《“十四五”全国档案事业发展规划》要求“加快档案资源数字转型。加强国家档案数字资源规划管理,逐步建立以档案数字资源为主导的档案资源体系。大力推进‘增量电子化’……继续做好‘存量数字化’”[2]。这意味着从21世纪第3个10年开始,档案数字资源将是档案资源的主要构成。 恰好就在这个时期,人类社会进入数智转型驱动新质生产力发展的新阶段。数据要素价值的社会共识不断加强,人工智能对高质量、大规模数据需求的凸显,数据概念和数据工作不断发展,促使档案界从数据的视角来审视档案资源和档案数字资源。档案数据概念兴起,相关研究比重不断加大。在此语境下,档案资源体系数字化转型即档案数据资源体系的建设。从档案资源体系到档案数字资源体系,再到档案数据资源体系,并非仅仅是适应当下形势的、简单的概念替换,而是意味着档案资源体系视角的转变、构成的变革及建设环节的拓展。冯泽宇等[3]提出构建“制度、组织、业务、技术、人才”五位一体的档案数据资源体系建设策略;丁家友等[4]提出动态平衡的档案数据资源生态要素、多主体协同的档案内容服务、多源异构档案数据共享等档案数据资源生态圈构建维度;金培中等[5]分享了嘉兴市档案馆数据资源建设的成果。但是,尚未有研究对档案资源体系建设整体变革加以体系化梳理和方向性建构。本文从档案数据资源体系建设需求变化入手,阐述数智化演进过程中其结构变化和建设内容的拓展。 一、需求升级:从档案数字资源体系到档案数据资源体系 《“十四五”全国档案事业发展规划》中所明确的档案资源体系的主导——档案数字资源是《中华人民共和国档案法》中的概念,根据权威释义,档案数字资源是对“电子档案、传统载体档案数字化成果以及其他具有档案属性或档案价值的数字资源的统称”[6],该概念侧重强调档案作为数字形式的数据资源的全面覆盖性。而档案行业标准《档案数字资源备份实施规范》(DA/T 99—2024)则指出,档案数字资源是“以数字形式存在的各类档案信息资源,包括电子档案及其元数据、档案目录数据、传统载体档案数字化成果等”[7],该概念则强调数字形式的档案及其元数据、目录数据。 档案数据资源是从数据视角对档案数字资源概念的丰富、深化和发展。我们当然可以顾名思义地理解为由档案数据构成的资源体系。鉴于学界和业界现有多种关于“档案数据”的理解,其边界宽窄不同,既有将其界定为数字档案(包含原生性电子文件和档案数字化成果)及元数据和目录,也有将其描述为档案数据化的结果,还可能包括档案管理业务的数据。[8]面对数智转型时代背景下国民经济和社会发展对数据资源质量和规模的迫切需求,本文提倡立足资源定位,即以档案资源为基础,尽可能包容地来建构档案数据和档案数据资源体系的概念。档案数据资源体系是指通过采集、整合、加工等方式所构建起来的档案及其衍生、关联数据的有机整体,其体系性不仅表现在多种类型的数字档案上,也表现在由数字档案衍生、与数字档案关联的其他数据上,包括元数据(目录)、档案数据化结果、相关数据等。 从档案资源体系到档案数据资源体系的概念转变,是实施数字中国战略的需要。2023年2月,中共中央、国务院联合颁布《数字中国建设整体布局规划》,[9]数据资源体系成为数字中国的两大基础之一。虽然广义的数据是任何形式的信息记录,[10]但作为在数字时代不断加强的概念,数据自带数字属性,在数字空间,数据通常是数字数据的代名词。档案是经过选择的、有保存价值的业务信息记录,具有真实性、关联性和不可再生性,因而也是重要的、法定的数据类型。从数据的视角来看,数字空间中的档案资源体系是无可争议的档案数据资源体系,因而也是数字中国数据底座重要的构成。 从档案资源体系到档案数据资源体系的概念转变,也是激活档案数据要素价值的需要。中国是最早提出数据要素的国家,2019年10月,党的十九届四中全会首次将数据纳入生产要素范畴,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》《“数据要素×”三年行动计划(2024-2026年)》等数据政策相继出台,通过数据资源流通应用发挥其经济价值的政策路线非常坚定。档案界也掀起档案数据要素研究的热潮。[11]人工智能技术的发展进一步激发了档案数据价值的潜能。数智转型不断发展形势下,要求更多从价值实现的角度推动档案数据资源体系的建设。 二、结构扩张:从档案原文数据到衍生档案数据资源 如果说传统环境下档案资源体系的构成主要是“档案+目录”,数字环境下档案资源体系的构成变为“原文数据库+目录数据库”,到了数据作为人工智能重要燃料和产出内容的数智时代,档案数据资源体系的构成不应止步于此,而要在面向业务场景发挥档案数据价值观念的引导下不断丰富资源体系构成。在横向上,在“应归尽归,应收尽收”的工作导向下不断优化资源结构,同时加强对其他信息记录、文献数据的主动收集;在纵向上,伴随“存量数字化”和“增量电子化”的不断推进,以获得可供计算机理解、分析和计算的数据为目标的档案数据化不断深入,面向新一代用户的档案数据产品不断发展,档案数据资源体系以原文数据及其描述性数据为基础,通过加工处理不断衍生,扩展至包括多维标签、知识单元、档案信息产品等多层次资源在内的复杂体系。