一、问题的提出 柏拉图(1986)在《理想国》一书中,曾经提出过一个“洞中流影”的比喻。描述的是生活在洞穴中的一些人只能通过外界事物投射到墙壁上不断变化的影子来认识外部世界,并把这种“流影”视为外部世界本身。如果说“洞中流影”的比喻描述了一种通过特定介质来认识和理解世界的方式,那么在生成式人工智能技术兴起和日渐普及的今天,这一认识和理解世界的方式开始变得越发普及。例如,越来越多的行业通过人工智能技术或者平台来构建一种“流影”,将经由人工智能算法所生成的对象(语句、图像等)视为一种可以代表现实世界的“真实”状态,并通过对其进行修改、组合来加以应用。①在社会科学研究中,这种“洞中流影”的比喻生动地体现在研究者对硅基样本(silicon sample)的使用上。所谓硅基样本,也被称为合成样本(synthetic sample),泛指通过生成式人工智能方法,立足于海量数据所生成的“模拟”信息(Argyle et al.,2023)。例如,利用提示词,要求ChatGPT“扮演”具有某种特质的个体(如大学生),之后要求其回答一系列针对此类个体的问题(如完成一份关于大学生生活的问卷等)。这种人工智能技术所提供的答案便构成了所谓的硅基样本。硅基样本通过大语言模型平台的中介,“分隔”开了研究人员和社会生活中的个体。大量有关社会现实状况的信息作为输入资料被用以构建预训练模型,并通过提示词来提供一种“拟人”式的回答,这一过程很形象地体现了“洞中流影”的比喻。 硅基样本的使用从多个方面挑战了传统社会科学的研究进路。一方面,社会科学当下的主流研究过程仍然遵循华莱士(Wallace,1996)所提出的“科学之轮”模型:从理论推演假设,然后通过质性或者量化的手段收集资料验证假设,进而推进理论发展。但是,如果基于生成式人工智能对行动者的“扮演”就足以获取足量、准确的数据,那么社会科学研究便完全可以“逆转”这一流程,跳过理论导向的假设,通过“数据驱动”直接从数据中挖掘理论生长点(陈茁、陈云松,2023)。另一方面,就数据收集过程而言,传统社会科学的数据收集立足于“研究者—被研究对象”的二元互动(除了非介入性研究之外,主流的质性或量化方法均是如此)。但是,硅基样本所体现的却是“研究者—硅基信息—大语言模型—被研究对象”的数据生成链条。这意味着,传统的那种研究者和被研究对象的直接联系被打破,取而代之的是人工智能产品这一“中介”。 那么,这种硅基样本的使用,是否可以达到社会科学研究者对于数据质量的期待呢?对于这个问题,实际上早已有了一个“一般性”的答案。硅基样本的使用可以被看作是“机器能否替代人”这一经典话题在社会科学研究领域内的具体表现。对于后者,一个被普遍接受的“共识”是,机器并不能够完全取代人,但是机器所提供的便利可资利用,因此我们需要采用一种“审慎”的态度,在力图避免由使用机器而带来的各种弊病的同时,发挥机器的价值(丁磊,2023;张彦坤等,2023)。对于硅基样本的使用,既有研究也指向了类似的“审慎”态度:硅基样本可以和现实调查资料在一系列数据特征上保持一致(Hagendorff et al.,2023),但其“类人性”的思考模拟仍不够“智能”(Binz & Schulz,2023)。因此,硅基样本对人类数据的“趋近”仍然是有条件的,研究者需要时刻反思应用过程中可能出现的偏误(Grossmann et al.,2023;Sarstedt et al.,2024)。 在这一背景下,对于社会科学研究者而言,关键不在于“要不要使用硅基样本”或者“研究者要不要谨慎使用硅基样本”这种原则性问题,而是在于“如何谨慎地使用”这种操作性问题,而这正是本文的主题所在。在分析和梳理既有文献的基础上,本文从提示词、硅基数据特征和数据分析范式三个方面来系统讨论使用硅基样本可能面对的潜在风险或者局限,以此为使用硅基样本的社会科学经验研究者提供一个全面的图景,从而帮助研究者“避险”或者形成对自身研究的反思。因此,本文的内容力图将各种可能的潜在风险进行系统性的阐述。相比于对生成式人工智能在社会科学领域应用的已有讨论,本文的贡献有以下四点。第一,充分借鉴了社会科学之外自然科学研究对生成式人工智能应用的讨论和反思,以此和社会科学研究形成互镜。第二,原创性地提出硅基样本使用过程中的多个局限之处,例如提示词的特异性、过度修正等。第三,结合社会科学研究的逻辑和范式,对大语言模型的常见错误进行社会科学实践性讨论。如通过溯因推理的研究逻辑反思正确答案效应引起的数据扭曲问题,将硅基样本的使用局限和社会科学研究者熟悉的理性选择理论、数据过拟合等议题联系起来。第四,除了实操层面的考察,本文也将分析上升到范式层次来讨论硅基样本的潜在问题。需要说明的是,本文的立足点是在给定技术条件下(如特定的ChatGPT版本等),社会科学研究者在“使用”硅基样本过程中可能遇到的局限性,因此并不涉及大语言模型的技术细节。②此外,本文的讨论虽然重在反思硅基样本的“问题”,但这种反思并非否定硅基样本对于社会科学研究的独有价值,而是希望提醒社会科学研究者,在使用硅基样本的时候不可过于放大其优势而忽视其潜在的局限和偏误。当然,生成式人工智能技术也在不断更新。随着版本的后续变化,本文所提出的诸种局限或许在未来可以得到有效的应对。