[中图分类号]K29 [文献标识码]A [文章编号]1000-5110(2021)04-0021-10 过去研究者曾对近代中国“主权”概念的形成进行研究,指出1905年基于国家、国民、民族主义、革命、立宪共识等概念都出现或完成近代转型后,现代主权观才真正确立,而这正是中国成为现代民族国家的时间点。①然而,在进一步的研究中我们认识到,现代“主权”概念的确立,不仅包括国家、国民、民族主义等作为民族国家自我主体性认同的对内概念,以及基于如“夷人”“洋人”“西人”或“天下”“万国”“世界”等对他者认知的对外概念,还包含作为现代民族国家的中国对介于“国家/自我”与“世界/他者”之间的“边疆”的认识。正如有研究者所指出的那样,正是在近代中国意识到“世界”后,“边疆”方成为民族国家地缘机体(Geo-Body)的一部分。②据此,我们认为,中国唯有近代“边疆”概念也完成近代转型,才算是真正全面转变成为现代民族国家。 边疆概念史研究可谓是中国边疆史乃至于中国近代史研究领域中的重要议题之一,早前学者已围绕此议题进行过诸多研究,例如从“边陲”到“边疆”的概念演变中揭示乾隆君臣经略西北的观念变迁,或是从古地图角度谈西域观的变化,甚至是从全球史高度谈全球边疆思想史的研究问题。③然诚如概念史学家赖夏特(Rolf Reichart)曾指出的,进行概念研究之际,不能仅考察单一概念,须同时考察对等、对立与补充概念,从线性的“单独词语分析”拓展为“词语群”“概念架构”“概念网络”的立体分析。④与此同时,基于汉语特性,又必须得先掌握“边”与“疆”的单词概念在近代的转变轨迹,方能理解“边疆”概念是何时以及如何从传统转向近代。⑤然而,受制于人力所限,传统研究方法无法穷尽巨量的历史史料、进而勾勒出系统且整体性的概念全图。要想处理具有规模性、发现性、实验性等特性的长时段概念群研究问题,则需通过擅长处理长时段、复杂性、巨量史料的数字概念史方法,方能勾勒出中国近代百年中边疆概念群的整体与系统的发展轨迹,从中揭示出“边疆”概念的改变时刻。 二、“边”的概念群研究 在以往的边疆概念史研究中,研究者多关注双音节词,诸如边陲、边疆、边界、边地等词汇,但并未着重于单字的整体性概念演化。为此,我们选取“中国近现代思想史专业数据库(1830-1930)”(以下简称数据库)⑥所收集的一亿两千万字近现代史料文献作为主要研究范畴,首先通过数据驱动计算出数据库中所有以“边”字为词缀的词汇,再通过观察数据线索发现并提出问题。⑦ (一)词族表:概念的系统结构 基于前述讨论,我们尝试通过以下步骤确定“边”概念的词族表:首先,先以“边”字为检索词,从数据库中下载以“边”字为中心、前后各10字、每条共计20字左右的视窗单元语料,共计有33034条,出现于9908篇文章,总字数为712421字符(包括符号与英文)。第二,以N-gram技术对3万余条语料进行Bigram断词。第三,依据断词后所得的所有双音节词在数据库中出现的词频,撷取以“边”字作为前缀与后缀的所有词汇。第四,以人工过滤的方式筛除以“边”字为前后缀的所有词汇中与“边疆”无关的噪音词,如边沁、边氏、边际、一边、东边、两边、海边、北边等。最后,基于人机互动所得到的带有边疆性的概念词群,画出词频列表如表1。
表1中带有边疆性的概念群,是通过数据驱动得出的客观词表,由此可快速、远距地掌握自1830-1930年长达百年间以“边”字为前后缀的概念词群。由这些“边”的词群所组成的“边的词族”,可视为“边”的概念的语言系统再现结构。从上表数据中可见,中国近代百年来对“边”的概念认知,具有四个重点:其一,主要关注军事与政治边疆,如边界、边境、边疆、边地等,较少文化边疆议题;其二,在“动词+边”的形式中,如固边、防边、守边、靖边等,可以观察政府行为中的防守、平靖等对边策略;其三,在“地名+边”的形式中,如滇边、粤边、黔边等,可以发现中国近代政府在边疆问题上主要关注的地点;其四,“第一人称+边”的“我边”一词,代表晚清中国作为封建王朝对边地自主性的主体性表征。 (二)CUSUM图:概念的时间序列 前述词族表是使用数字人文技术,远距地勾勒出中国近代“边”的概念系统结构。而想要进一步观察中国近代“边”的词族在近代百年间的时序发展序列轨迹,则需借助数字概念史方法中的CUSUM图。⑩研究步骤如下:首先,计算表1中“边”的前后缀词在百年间的历年词频使用次数;其次,运用CUSUM方法计算“边”的前后缀词汇在历年的使用比例累加值变化情况,绘制成图,如图1所示。