我们正在走向深度智能化时代,人和世界日益被信息和计算所嵌入,人们在面对机器能否超越人类智能这一挑战之前,就生活在基于人机数据交互的各种智能系统之中。透过当前数据驱动的人工智能应用,不难看到,深度智能化时代不仅意味着对事物的自动化认知和控制,也令人本身成为机器智能运用算法(algorithm)加以认知与操控的对象。在人们惊叹智能算法强大力量的同时,大数据杀熟、算法歧视、“智能监测”等隐蔽而普遍存在的问题不断曝光,算法滥用成为理论批判、舆论批评甚至监管的对象,算法的透明度、可解释性、公正与非歧视以及可问责等方面的规范性要求成为数字技术的法律和伦理治理的焦点。但在实践层面,不论是对算法的批判——如将其认定为数字时代的意识形态,还是以透明和反歧视的法规和伦理规范对其加以治理,固然有助于形成舆论与合规的压力并促使相关主体改进其行为,但往往是跟在此起彼伏的问题后面,要么流于形式,要么过于严苛,一直面临防不胜防的窘境。究其原因,是因为这些单纯的伦理和法律考量未能深入探究智能算法这一全新机器控制方式的认知机制,更未看到算法认知对我们生活于其中的技术社会系统的基础性影响;而不能对它们有所洞察,就难以辨析问题的机理、症结与趋势,更无以探寻和实践标本兼治之道。在依照伦理原则和法律规定决定算法应如何运行、哪些算法应该禁止的同时,要看到算法治理的系统性、复杂性和长期性挑战。为此,应从多学科和更广阔的视阈聚焦算法认知过程与认知生态系统,系统地审视作为其背景和前景的伦理与政治结构及其嬗变,为深度智能化时代的治理奠定更加扎实和更具前瞻性的理论基础。 一、机器真理:从算法的客观性到算法认知的伦理与政治结构 自20世纪中期以来,信息论和控制论兴起,以其作为基础的计算机技术发展迅速,使当代人成为由各种各样的控制论机器联结而成的技术社会系统中的“科技智人”。随着数字技术的发展,控制论机器演化出新版本,它的“燃料”是由布满世界的传感器和网络源源不断地生成的数据流,其运行机制是由代码和软件构成的算法,不论称其为大数据与人工智能还是数据智能或计算智能,“科技智人2.0”的生存、生命和生活越来越多地托付给基于数据和算法的自动化感知、认知和决策。展望未来,越来越多关于人的信息和数据将被搜集和分析,不仅你说什么、做什么、去哪里和跟谁在一起被实时捕捉,而且你想什么、感受如何甚至将要做什么,也成为智能算法预见和干预的目标。 什么是算法?从语义上讲,算法在当代的含义多指一组旨在达成某种预期的结果而展开的正式的过程或按步骤进行的程序。在词源上,一般认为算法一词来自中世纪波斯学者花拉子(Al-Khwarizmi)的名字衍生的拉丁词“algorismus”,意指使用印度—阿拉伯十进制数字进行四则运算的手动程序——而此前的罗马数字只便于做加减法。这便赋予算法以程序化数学运算的基本内涵,即能够在有限数量的步骤中产生问题的答案或解决方案的系统的数学程序或捷径。直到20世纪初,阿拉伯数字还常被称为“算法数字”(the number of algorism),它使工商业发展所需要的复杂的会计活动成为可能。换言之,算法建立在一套能有效地解决问题的编码系统之上。现代意义上的算法是计算机和数字技术的产物,指以计算和信息的方式解决问题的、可通过递归等机器自动重复执行的逻辑程序或编码系统。当前,随着大数据与人工智能的发展,人们对算法的相关讨论更多聚焦于数据驱动的机器学习算法。 实际上,正如法国数学家让-吕克·夏伯特(Jean-Luc Chabert)在《算法史》(1994)一书开篇所指出的那样,算法自人类文明之初就有,在人们创造一个特殊的词来描述它们之前就已经存在了。在更加凸显文化的广义算法观看来,一旦人们找到了一套解决问题的程序化方法,会很自然地将“配方”传递给他人。也就是说,不论十进制四则运算的算法还是二进制计算机的算法,都是古代算法观念的产物。因此,广义的算法原本并不局限于数学和数字技术。在所有文化中,算法都被用于预测未来、决定着医疗和美食的配方与步骤,人们曾用它确定法律要点、校正语法。①也就是说,与其说数学和数字技术带来了算法,毋宁说是算法观念推动了数学和数字技术的应用。 尽管夏伯特的算法观更加强调算法的目的性及其与社会文化的相关性,但夏伯特的研究太早,没受到应有的关注。自20余年前谷歌搜索算法通过分析用户生成内容(UGC)开启这波数据驱动的智能算法应用以来,算法在科技和经济等主流话语中主要被视为抽象数学程序在数字技术前沿的应用,这使得基于算法的认知被默认为可以揭示事物的相关性的客观的“机器真理”。特别是大数据和人工智能的迅猛发展,使得具有经验主义色彩的数据驱动的智能和算法的认知功能被夸大。其追捧者相信或声称,数据可以呈现世界的一切,甚至成为比世界更真实、更直接的认知对象,通过智能算法能让数据或原始数据说话,从而揭示关于世界的所有真相与趋势。