中图分类号:G644 文献标识码:A 文章编号:1003-7667(2023)01-0044-10 DOI:10.20013/j.cnki.ICE.2023.01.05 一、问题提出 数字时代开启以来,人工智能、机器学习正以不可逆转之势进入人类互动、舆论传播与学习科学等领域,并凭借以数字算法为代表的信息技术变革文科知识生产的研究范式。[1]智能技术既可以跟踪千万级群体的实时互动,又能精准捕捉个体级别的行动轨迹。2009年,以大卫·拉泽(David Lazer)为首的15位科学家在《科学》杂志上以“计算社会科学”为题高度概括了大数据参与文科知识生产的可能路径。[2]这代表了社交媒体、非结构化文本与视频图像正成为新的数据来源,而信息转变为知识的方式在技术的驱动下不断多样化,文科知识生产在数字时代已被重新定义。相反,传统的知识生产范式已经难以回应知识更新的时代需求,甚至过细的分科研究与科层化的学术管理成为学术研究迭代与创新的制度化障碍。面对智能社会,大学是否有能力应对文科知识生产数字化的挑战,已经成为其推动知识创新与回应社会需求必须要面对的课题。 在智能时代,文科知识生产有两个典型特征:一是就现实而言,它使用大规模的结构性数据与信息处理作为解释人类社会及其内部结构的关键成分,清晰且立体地建构真实的社会系统网络;[3]二是从方法来看,它既非以同一学科知识为蓝本的知识更新,亦非社会科学与数据科学的跨域叠加,而是多学科研究者的协同合作以及企业、政府与公民社会的深度参与。[4]实践证明,不同于知识生产模式Ⅰ与Ⅱ,这是典型的超学科研究与知识生产模式Ⅲ。该范式一定程度回应了现实问题,但从大数据所推动的经验研究飞跃到社会科学的理论阐释时,仍然面临不小的创新困境。同时,跨越边界的数据合作隐含着更大的隐私、伦理与知识产权问题,而回应这些问题既无法依靠传统知识生产进路加以减缓,也不能通过数字技术革命予以祛除,其关键在于建构一个行之有效的运行保障机制。 在运行机制方面,西方大学通过创建更加灵活的数字空间和知识生产体系,与互联网平台、政府数据部门建立了知识创新网络,从而实现数据—知识—决策之间的高效转化。已有研究看到了知识创新的技术优越性与数据便捷性,但却较少探究其背后的运行机制与各要素的互动关系。[5]因此,本研究旨在分析世界一流大学计算社会科学实验室知识生产过程,并深刻剖析文科知识生产数字化背后的运行机制。
二、研究设计 (一)理论抽样与研究方法 在案例选择方面,本研究通过多渠道收集了78个世界一流大学计算社会科学实验室素材,从而形成分析该问题的初步案例资料库。为了更加精准地匹配适切案例进入分析,对备选案例库进行了理论抽样。抽样原则体现在四个方面:一是所选实验室在人文社会科学领域具有代表性,其所属高校为全球排名前列的精英高校;二是所选机构与数据平台、政府、社会建立了长期合作;三是机构类型尽可能地涵盖人文社会科学诸领域;四是所选案例资料至少由网站信息、学术论文、媒体资料三种以上分析文本组成,且字数不低于0.8万字。基于上述原则,最终遴选了26个案例作为研究样本。 研究采用扎根理论方法并基于Nvivo 12.0软件从26个实验室案例样本中随机抽取18个案例,对所涉案例的相关资料采取开放式编码、主轴编码与选择性编码,并分类、提炼与概括数字时代计算社会科学实验室知识生产的关键信息,据此建立与研究问题相契合的分析框架。然后,利用剩余的8个案例资料进行饱和度检验,从而确定得出最后的研究模型。 (二)资料收集 为了系统呈现26个计算社会科学实验室的样本信息,本研究列举了所选案例概况(详见表1)。为了最大限度地还原各实验室的知识生产过程,本研究从实验室官网、学术论文、研究报告与媒体宣传四个方面收集了各案例的文字、视频与图片信息,并将其全部转换为统一的文本信息,按照抽样编码原则进行归类编号,以此作为后续分析的数据资料支撑。 三、资料编码分析 在组织社会学语境下,机制是指组织内部各要素之间的结构关系及其运作方式,而运行机制是指影响组织活动的因素、结构、功能及其相互关系,以及诸因素所产生影响的作用过程与运作方式。[6]因此,本研究基于扎根理论旨在挖掘计算社会科学实验室知识生产过程的核心要素及其诸要素相互作用机制,以此刻画数字时代文科知识生产的运行过程。 (一)概念与范畴化 开放式编码是基于研究的问题情境对原始素材进行提炼与概括,进而形成初始概念及其范畴化的过程。为此,本研究根据随机原则抽取18个正式样本,除A-05、A-09、A-12、A-14、A-18、A-19、A-21与A-24未入选外,其余案例进入分析阶段。随后,将入选案例材料导入Nvivo12软件中进行编码,经过反复比对、归纳与整合,最终提炼出43个初始概念,并进一步归纳为包含应用服务、项目治理、数字协作与外部问责在内的13个初始范畴。(详见表2)