中图分类号:B017 文献标志码:A 文章编号:1002-0292(2021)03-0005-08 尽管“大数据”尚且未有确切的定义,然而毋庸置疑,随着计算机和互联网技术日益渗透进社会生活的方方面面,大数据时代已然降临。我们周围的世界充斥着的数据数量已达到天文数字,并且呈指数级增长,信息的类型也多种多样。智能手机、社交媒体、智能家居、可穿戴设备以及各种传感设备源源不断地产生和共享着海量的数据。克劳斯和维拉尔德将如此这般的新世界称之为“新信息社会”。他们指出,“在这个世界上,一切都是可以测量的,人们和你能想到的几乎所有设备都通过互联网全天候连接。这个由连接和传感器组成的网络产生了惊人数量的数据,并提供了令人着迷的新可能性,这些可能性合起来通常被称为大数据”[1]xiv。大数据正在以前所未有的深度和广度真实而有力地形塑和改造着我们的世界以及我们的思维方式、行为方式。正如维克托与肯尼思在《大数据时代:生活、工作与思维的大变革》一书中所作的论断:“大数据开启了一次重大的时代转型。”[2]9新世界观的大门或许已经开启。 大数据这种新兴技术对社会几乎所有方面产生了巨大影响,这无疑是一个挑战,但也提供了巨大的机会。有的学者借助“断裂时代”[3]10一词来描述大数据引发的社会的急遽变迁。大数据引发的根本性转变也体现在我们的研究方式和思考方式等方面。可以说,大数据在认识论层面上带来一个深刻的变化。“大数据重构了知识构成、研究过程、我们应该如何处理信息以及现实的性质和分类等关键问题……大数据勾勒出了新的对象、认识方法和社会生活定义。”[4]认知方式的转变必然会导致新旧认识论范式之间的争论。审视传统的认识论,改造大数据建构的新认识论,从而发掘能将大数据合理嵌入我们社会的批判性的认识论,将是本文尝试完成的任务。 21世纪以来,大数据的发展和应用率先在科学研究领域引发了激烈的讨论。2010年《自然》杂志刊发了一组关于生物学研究方法的论战性文章,论战双方分别为戈卢布和温伯格。前者坚持“数据驱动”的观点,认为大规模的生物研究数据采集方法为癌症研究提供了新线索,这种依托大数据的新研究方法与传统的实验方法相比具有显著的优势[5];而后者肯定科学实验的至高无上性,认为理论驱动科学的成功是显而易见和不可否认的[6]。“数据驱动”与“理论驱动”之间的争论与赫拉利在《未来简史:从智人到智神》中所阐述的“数据主义”和“人文主义”之争近乎对应。其中,人文主义强调作为主体的人为世间万事万物赋予意义,而数据主义则认为我们不需要甚至不可能从内心寻求意义,算法能够帮助我们找出体验的意义,而人的体验在本质上没有任何价值[7]349。 极端的数据驱动的立场被称之为“数据原教旨主义”[8]。这种立场认为相关性能够代表甚至代替因果关系,大量数据集和预测分析总是反映客观事实,使得我们足以洞察和解决各种棘手的难题。“数据原教旨主义”恪守如下的信念:“一旦完成了收集数据的简单工作,数据就会自己说话。”[9]180赫拉利也将此种“数据原教旨主义”称之为“数据宗教”。人们的言行举止皆能被还原为数据,“你说的每个字、你的每个举动,都是伟大数据流的一部分,算法一直看着你,也在意你的所有想法和感受”[7]349。汹涌的大数据浪潮席卷现代生活的各个领域,其在认识论领域引发的革命自然也成为学术界高度关注的话题。 在数据主义者看来,大数据能够轻松、准确、全面地反映世界,把握我们日常生活和周围事物的关系,并且快速、有效地作出分析和预判。作为“完美的媒介”,大数据提供了与模拟时代截然不同的认识世界和理解世界的方式。“大数据”这一概念不仅表明数据的量相较于模拟时代趋近于穷尽,而且还显示出数据的质趋近于动态、细节和丰富。简言之,大数据“越来越被理解为接近‘现实’本身”[10]。人类的认知范围是有限的,但是大数据可以收集、聚合、存储并且分析那些我们尚未发现或者难以触及的事实。大数据似乎正在构建一个如耶鲁大学计算机科学教授杰勒恩特所畅想的“镜像世界”。可以说,它完美地还原了现实世界,“大量的信息源源不断地涌入模型(通过一个巨大的迷宫般的软件管道):如此之多的信息使得模型可以每时每刻地模仿现实的一举一动”[11]3。借助数据化的“镜像世界”,我们可以观察并掌握整个复杂的世界系统。这种日常生活的“数据化”是大数据系统的核心:“通过将互动和关系呈现在表面,使它们可见、可读并因此可治理,而不是寻求理解隐藏的因果规律来获取现实。”[10] 相关性被数据主义者认定为大数据所提供的了解世界的新方式。对《连线》杂志主编安德森来说,大数据标志着一场知识革命,它宣告了假设科学方法的过时。正如安德森高呼“理论已终结”[12],许多数据主义者认为相关性对于我们而言已经足够了,通过算法分析数据就能发现科学无法找到的信息,理论主导的认知方式濒临淘汰的边缘。“大数据不仅仅是理解和改变世界的众多工具中的一种;它是必不可少的,而包括科学在内的所有其他方法,即指导现代世界及其认识方式的方法,都可以被扫进历史的垃圾箱。”[9]194科学的进步由此可以不依赖于连贯的模型或者统一的理论。大数据的相关关系分析法被认为有诸多优势,它的运作更加快速,也更为准确,而且不易受到偏见的影响。慢速的因果分析则需要借助严格控制的实验来验证因果关系,必然耗时耗力。因此,坚持“数据驱动”观点的人始终相信,“随着由假想时代到数据时代的过渡,我们也很可能认为我们不再需要理论了”[2]92。许多相关的科研人员或许难逃被降格为数据之附属品的命运,诚如艾尔斯所描述的那样,“统计不再是专家选择的仆人,专家变成了统计机器的仆人”[13]117。维克托与肯尼思也预测在未来行业专家的主导地位将被大数据人才所取代,因为大数据时代不需要人的直觉和经验指导我们作出决定[2]181。