修回日期:2023-04-06 本文起止页码:3-14 分类号:G270 DOI:10.13266/j.issn.0252-3116.2023.12.001 1 引言 大数据时代,数据爆炸式产生、指数级增长,数据价值日益凸显,成为重塑信息时空、构筑“元宇宙”的关键媒介。数据化浪潮从源头上改变了信息生成、记录、存储、传播和利用的方式,一个更加数据化的社会文明形态与信息资源时空加速演化形成。从结绳记事、简牍载道、纸卷书写再到现在的数字原生,数据日益成为信息社会信息资源的主要呈现形式。档案作为人类社会实践活动产生的原始记录信息,不可避免地植入数据化沃土中,档案事业正酝酿和掀起一场“数据革命”,推动档案工作深度融入数字中国、智慧社会、国家大数据等重大战略中。随着档案数据管理实践与理论研究的深入,档案数据已成为大数据时代档案信息资源建设新形态与档案学理论研究新方向。学科对象的变化必然引发学科知识体系的重组再造,内涵质性则是理论研究要突破的元命题。 当前,档案界关于档案数据的基本定义、本体属性、运行机理等理论体系研究尚处于探索阶段,档案数据内涵多样、范畴模糊、边界泛化等情况时有发生,掣肘档案数据理论研究深化与管理效率提升。为此,针对档案数据概念不清、内涵模糊、管理薄弱等问题瓶颈,聚焦档案数据理论内涵深化与实践创新发展,立足档案与数据协同视角,遵循“档案数据化+数据档案化=档案数据”的总体思路与传导机理,通过辩证分析、比较研究与系统建构等研究方法,从档案数据化与数据档案化双向维度探察透析档案数据理论内涵与管理策略,为档案事业注入数据科学与数据管理理论知识,构筑档案数据化生存空间;为数据管理注入档案管理理念方法,重塑数据档案化管理体系,促进数据有序归档与规范运行。通过“引进来”与“走出去”相结合,拓展档案管理职能与场域,提升档案部门的社会影响力与认同感。 2 档案数据研究论域的兴起 档案数据是指具有档案性质的数据记录,也就是数据形式的档案资源。大数据时代,“现代信息技术的应用和各种移动终端的生成,促使电子文件、社交媒体、数字文本、用户踪迹等移动信息、泛在数据大规模生成”[1],各类档案数据不断累积与急剧增长,推动档案形态加速从传统纸质记录的“模拟态”向磁光电记录的“数字态”“数据态”质变,档案数据成为档案学研究的新课题与新领域。 2.1 档案数据兴起背景 档案数据作为大数据时代档案信息资源的新形态和档案管理的新场域,已成为档案学的理论前沿与学术热点,档案数据研究论域的兴起有其特定的时代背景与理论情境,明确档案数据的兴起背景有助于从源头上探察档案数据的生成环境和发展动机,把握档案数据的演化规律和运行态势。 (1)实践背景:大数据浪潮席卷全球,催生档案事业数据化革命。自2013年世界加速迈向量化万物、智化生存的大数据时代,标志着人类进入信息社会新阶段。围绕数据这一“新的石油”,美国、英国、法国等国家纷纷制定大数据发展战略,抢占新一轮国际竞争制高点。2015年,党的十八届五中全会明确提出“实施国家大数据战略”,将大数据正式上升为国家战略。随着移动互联、数字政府、数字经济、数字社会等的深入发展,数据规模迅速膨胀、数据设施日益完备、数据技术推陈出新、数据机构层出不穷,社会各行各业加速向数据业态转型。人类数据生产、计算、开发能力的提升也在倒逼数据存储管理能力的进阶。随着政务数据大量产生、传统档案数据化处理转换与电子文件单套制推广普及,档案来源数据化、管理数据化、利用数据化的生态格局加速形成,档案事业正在经历一场数据化引发的重大变革。 (2)理论背景:数据科学持续发酵,驱动档案学学科范式转型。大数据时代催生了一门新的学科——数据科学。“数据科学是一门关于大数据的科学,即包括大数据时代出现的新的理念、理论、方法、技术、工具、应用与实践在内的一整套知识体系。”[2]数据科学旨在揭示大数据现象及其运动规律,促进数据向信息、知识、智慧层面转化。在大数据及数据科学的强势渗透下,一种以数据为驱动的新型科学范式正在形成,使得人类科学研究由原始社会的“实验科学范式”、模型归纳为特征的“理论科学范式”、模拟仿真为特征的“计算科学范式”向以预测分析为特征的“数据密集型科学范式”嬗变[3]。数据科学的兴起,促使档案学研究对象进一步向档案数据延伸。引入数据科学和数据管理的理论方法,促使档案学与计算机科学、智能科学、数学等交叉融合,探索构建档案数据科学理论体系,促进大数据时代档案学理论深化、知识交融与学术创新。 2.2 档案数据研究主题 档案数据作为近年来档案界持续关注的热点题域和实践前沿,是拓展档案学研究空间与思维视野的学术增长点,也是推动档案信息资源建设、创新档案管理业务模式的重要路径。基于中国知网文献资源库,以“篇名”=“档案数据”为检索字段,来源类别为“CSSCI”“北大核心”,时间截至2022年9月30日,共得到文献182篇,研究内容主要分布在以下四方面: (1)档案数据概念解析。针对档案数据,学界尚未形成统一认识。“档案数据”一词最初产生于20世纪八九十年代办公自动化阶段,与计算机应用息息相关,主要指输入计算机系统并被检索的档案资源。进入大数据时代,档案数据迅速成为档案领域关注的焦点,对档案数据内涵外延的理解也日益丰富。2018年于英香从数据与信息的关系演化出发,提出“从内涵看,档案数据是一种具备档案属性的数据;从外延看,档案数据包括电子文档、数字资源等。”[4]2020年金波等提出,“档案数据是数据化的档案信息及具备档案性质的数据记录。”[5]2021年赵跃等立足不同的学科语境,将档案数据理解为“关于档案的数据”[6]。