0 引言 行政区划(又称行政区域划分),是国家治理体系的重要组成部分,通常依据相关法律和标准,并综合考虑地理环境、人口分布和经济发展等因素,对地方治理、资源配置和统计分析等领域具有基础性支撑作用[1-2]。行政区划沿革则指行政区划在隶属关系、名称和空间形态等方面的变更过程,反映了国家政治格局的调整、社会结构的演进与区域经济的动态发展,是理解区域变迁的重要视角。 随着“数字中国”和智慧政务建设的推进,行政区划数据的时空建模需求日益凸显[3]。当前关于行政区划数据多以静态方式处理,对历史变更信息的系统记录与语义表达尚显不足,易导致跨时期数据分析失真、空间定位存在偏差等。因而亟须探索行政区划沿革的系统建模与动态表达,开展结构化、语义化和时空化的组织与管理,以支撑跨时空数据的准确对齐与综合利用。知识图谱作为新一代的信息组织技术,在知识表示、推理与互联等方面具有显著优势[4-5],并已在地理信息管理中展现潜力。然而,在行政区划沿革领域,知识图谱的应用仍处于起步阶段,尚缺乏系统的本体设计与实践范式。 本研究从行政区划沿革知识提取和表达视角出发,提出一套面向行政区划沿革的知识图谱构建框架。研究结合本体建模技术,综合地名、时间与演变类型等要素,以上海市1949年以来的行政区划变迁为实证,构建上海市行政区划沿革知识图谱实例,并探索其语义组织方式及应用潜力。本研究旨在建立行政区划数据的统一语义表达体系,为跨时空分析提供方法论支持与技术实现。通过实现行政沿革的可视化查询、提升地理编码的准确性以及改进统计数据的对齐机制,本研究不仅丰富了知识图谱在历史地理信息领域的应用场景,也为相关服务的智能化与精细化发展奠定了基础。 1 相关研究 当前行政区划沿革数据主要存在分散异构、时空信息表达有限等问题。现有研究在组织与表达方式上大致包括:纯文本组织、静态空间数据建模、时空数据模型表达及知识图谱建模。纯文本的行政区划沿革数据组织不涉及地理空间维度[6-7],虽便于因果分析和统计研究,但缺乏空间表达能力。中国国家地名信息库[8]等静态空间数据虽具备地理定位功能,但由于缺乏时间维度与历史版本支持,其与其他动态数据(如人口)的关联性较低,无法满足时序查询与分析需求。为弥补这一不足,学者提出了多种时空数据建模方式,大致可以分为系列快照[9]、基态修正[10]、基于事件[11]与基于生存期模型[12]4种,但均存在一定局限性。序列快照模型在空间信息存储中容易造成数据冗余,查询效率较低;基态修正模型数据更新复杂,性能表现依赖于基态选择;基于事件的模型虽能反映时空变化,但构建的数据库结构相对复杂,实体演变链式过程不够直观;以中国历史地理信息系统(China Historical GIS,CHGIS)[12]为代表的“生存期”模型能够较好地描述基于点的行政区划沿革,但因将不同时间序列的行政区划单元存储在同一矢量文件中,较难实现动态可视化表达。此外,该模型在演变逻辑、语义建模与推理能力方面也有待发展。 近年来,知识图谱逐步应用于行政区划沿革建模,通过本体设计与图数据库技术实现结构化、语义化表达,支持跨时间的查询与推理。郑国轴等[13]在中文开放知识图谱(OpenKG)上发布了涵盖多级行政区划的资源描述框架(Resource Description Framework,RDF)数据,虽实现了隶属与空间关系建模,但未涉及空间几何与历史演变信息。李晓敏等[14]构建了地名演化图谱,采用事件逻辑实现区划沿革的时间关联,但未融合空间数据。陈玉冰[15]与陈书慧[16]分别聚焦区域行政变更,融合地图集等资料,构建了包含空间信息的沿革图谱,并探索了知识推理与历史模式挖掘方法。国际上,GeoNames提供了全球范围内的行政区划标准名称、层级结构与经纬度等地理信息,并支持RDF格式的数据下载与API调用,是结构化地理数据的重要来源[17-18],但其数据主要反映当前状态,对历史沿革支持有限。 在语义网与知识图谱构建中,本体作为抽象建模工具,用于描述特定领域内的概念集合及其之间的关系[19],可在语义层对行政区划概念、实体及其关系进行结构化表达。针对行政区划沿革中的时空复杂性,已有研究借鉴地理本体的建模思路,将要素、几何、空间关系和时态纳入建模框架。例如,宋佳等[20]基于GML范式,构建了包含要素、几何、空间关系和时态四部分的本体模型;杜萍[21]将中国行政区划本体划分为地理实体、空间、几何、时间和事件五部分,实现基于本体的行政区划地名识别与抽取;陈健等[22]以测绘学叙词表为基础,构建了包含地名实体、语义类型与空间关系的本体模型;李晓敏[14]则提出包括演变前身、变更过程等类别的演化本体,有效支持了沿革数据的语义关联。上述研究为本体在行政区划数据建模中的应用奠定了基础,但多数模型在空间表达方面仍较为简化,缺乏对完整几何边界与空间变化过程的支持。 国际上,众多学者也在积极探索地理知识图谱与时空建模的新路径。YUAN等[23]提出Spatiotemporal Evolution Hierarchical Representation Graph(STEHRG),通过本体层、演化层和要素层统一表达地理实体生命周期,强调时空演化的层级表示。LI等[24]构建了HGeoKG,以层级结构和语义推理增强地理知识组织能力。WEI等[25]提出FineGeoKG,能够精细建模地理实体之间的邻接关系,并支持复杂空间查询。尽管这些研究在方法论和技术层面丰富了时空知识图谱的发展,但仍未针对行政区划沿革这一特殊领域提出系统化解决方案。