近年来,抗战史研究日益重视探讨战争与人的关系。其中,如何从普通民众角度、个人观点来进行战争记忆的书写,进而反映战争所塑造的时空框架和时代氛围,成为学者关注的问题。在这方面,国外研究开展得较早。麦金农(Stephen R.Mackinnon)和弗里森(Oris Friesen)根据战时美国来华新闻记者口述资料呈现美国人眼中的中国抗战②。萧邦奇(R.Keith Schoppa)基于大量日记和回忆录,描绘抗战时期江浙一带难民“转乎沟壑”的苦难经历③。国内有关抗战记忆研究也主要依托名人日记、书信和回忆录等材料④。而底层百姓几乎没有受过正规教育,文化水平低下,即使留下一些文字,也比较简单,往往会被忽视。近来,学者越来越多地通过有组织的社会调查和口述采访,来获取更多人士的战争记忆⑤。 2006年起,王选、徐畅组织开展卫河流域战争灾难口述史研究调查⑥。该调查历时6年,走访卫河沿岸10个县区、106个乡镇,共采访2957位老人;同时还对周边30余县区进行摸底调查,采访113位亲历者与知情者,形成共计3070人次的口述史调查记录,于2017年出版《大贱年——1943年卫河流域战争灾难口述史》(以下简称《大贱年》)⑦。此前,围绕该地区的细菌战研究已有不少成果⑧,但学界对这些口述材料的利用尚不充分⑨。 事实上,《大贱年》在调查问卷设计时,已经认识到日军山东“霍乱作战”史实证明的复杂性,将调查采访的外延扩展到当地乡村民众苦难的家国记忆,包括战争以外的灾害、疫病及救治、生态环境以及人口迁移等。这些口述材料有助于让失语者发声,弥补历史遗漏,丰富历史细节,使久远的史实在个性化的叙述中更加丰富,逐步形成立体的模样。与名人回忆录相比,这批老人的口述材料具有规模大、信息量丰富等优点,但条理性和逻辑性较为薄弱⑩,通常口述资料由于各种原因,会被质疑其真实性和可靠性,产生“记忆污染”(11)或“选择性记忆”(12)。因此,在对其解读和应用方面提出了更高的要求。大样本提供研究者从个体到群体分析的可能性,能够通过标准化的信息提取与数据处理,获取口述文中共性的内容,再通过GIS进行空间可视化表达,将样本采集过程中带来的偏差控制在可信范围内,实现与档案、地方志等材料的相互印证。 本文探索口述材料利用研究的范式转换,即通过文本梳理,先依照统计学方法挖掘数量信息,整理成为可定量化处理的数据材料;将初步处理的数据通过行政区编码、经纬度定位等方式提取地理学信息,成为具有数量和空间含义的基础数据;通过参考地方志、社会调查等一系列材料,进一步对数据的时间序列进行匹配。最终形成包括数量与时空含义的多维数据,以此对历史情景的立体呈现提供技术参数支持,推动研究成果合理、科学和多样化的呈现。 一、搭建集体记忆研究的技术与方法 本文根据3000余份口述样本,对当时旱涝蝗灾、霍乱流行、民众逃荒等信息进行归纳统计,梳理出10县(区)灾害、疫病、逃荒的地域分布情况,并利用地理信息系统(GIS)和统计学工具,对1943年鲁西冀南地区的战争灾难进行时空分析。该研究不仅能够让我们了解民众对战争样貌与经历的描述,还对战争记忆加以反思,真实地衡量战争对人与社会的影响。 (一)“大贱年”的文本整理 研究宏观性的问题,需要足够多的样本量支撑分析,从而更加准确地把握现象本质。如何合理地利用全部文本材料,最大化地提取研究所需的信息,较为便捷的常用方法有机器学习的文本分析技术。但因“大贱年”口述调查文本呈现有一定特殊性,即编者为保证老人证言的原汁原味,在整理口述时,最大限度地保留了他们的方言和语言习惯,尤其是在一些记忆模糊的地名和人名处理上采用了取同音字注音等方式,这对于文本分析技术所要求的分词和特征词选择造成较大困难。为避免对文本核心信息造成损伤,我们最终还是采用人工整理方式,对口述史信息进行一一识别与提取。具体步骤如下: 首先,围绕“人”和“事件”,将调查时制定的访问问卷所涉及内容分为四大项,即受访人所属地、受访人基本信息、口述细节和备注。其次,以位于“大贱年”调查区域中心位置、同为重灾区的馆陶县为样本例,依照口述内容涉及的信息,在每一大项目下细分出若干小项,如在“受访者基本信息”下确定“姓名”“年龄”“属相”“出生年份”“性别”“采访时间”“时年(1943)年龄”等项,初步确定信息提取表格。最后,为避免某个县样本的单一不全面,再从其他卷中随机抽取若干样本填入表格,检查是否存在关键信息遗漏,并对每一大类项目下对应的小项进行补缺,最终确定了如表1-1所示的“样本信息提取表”。
第一项“受访人所属地”包括:老人被采访时的所在地(县—乡镇—村三级行政区划),以及依据老人口述内容补充的“时年(1943)所在地”。在记录“时年(1943)所在地”时,如果该老人口述中明确提及,则以口述为准。如果老人没有明确提到1943年所在地,但有“一直在这个村子”之类的描述性话语,考虑到该地区乡村人口流动中外来人员流入较少,因此默认男性老人目前居住的村子为“时年(1943)所在地”;而女性老人,由于存在嫁离娘家等因素的影响,“时年(1943)所在地”较难确定,则空缺不填。