中图分类号:TP391;D64 文献标识码:A 文章编号:1000-260X(2024)01-0152-09 当前,对算法与意识形态的研究已经成为国内外学界的研究热点、难点。尤其是随着以ChatGPT、Midjourney、Auto-GPT为代表的生成式人工智能的横空出世,算法从“幕后”走向“台前”,成为当下精神生产直接面对的技术逻辑。于是,对算法与意识形态的关联研究变得尤为紧迫。随着算法的普及化应用,算法的意识形态性暴露得愈加明显。但是,当前国内外学界事实上并没有严格区分算法的意识形态与意识形态的算法,而是进行混合式研究。研究对象的“交缠”不利于后续研究的深入,也不利于相关意识形态工作的经验总结。事实上,算法的意识形态与意识形态的算法是一体两面的关系。算法的意识形态是指算法技术在生产实践的普遍应用中,对意识形态传播、认同产生技术路径影响所形成的具有算法技术特征的观念集合。它是一种具有意识形态新特征的新型意识形态。意识形态的算法是指意识形态和算法应用逻辑在算法建构和应用过程中,使算法成为一种具有意识形态性的技术。正是在此意义上,系统、全面、客观地进行算法的意识形态与意识形态的算法的整体性研究,有利于廓清相关研究的研究对象,明晰不同研究对象的不同特点,为后续相关研究乃至工作开展提供更具针对性的信息和建议。 一、算法与算法的应用 将算法与意识形态作为一个整体现象进行研究时,必须关注其现实的逻辑起点,即何为算法,以及为什么算法会具有意识形态性。对这一问题的把握要具有算法技术和算法应用的双重视野。“工人要学会把机器和机器的资本主义应用区别开来,从而学会把自己的攻击从物质生产资料本身转向物质生产资料的社会使用形式”[1]。 (一)算法的技术图景 对算法的理解,要建立在数据和模型的认知基础之上。数据是对信息进行标记、洗练、注释等数据标注行为后形成的结构化、半结构化的能够被智能机器识别的数字载体,往往表现为图像、文本、视频、音乐等形式,是信息时代、人工智能时代的“石油”。“浩瀚的数据海洋就如同工业社会的石油资源”[2]。数据是算法的前提,是存在的存在。正是有了数据这个“有什么”,算法才能“怎么办”,得出“是什么”和“为什么”。模型则是算法在训练数据后建构的特定数据结构,由预测算法和模型数据组成。因此,算法其实就是数据处理的规则、条件和方法,通过代码设计一个特定程序和步骤,从而在信息数据收集的基础上完成对数据的分类、回归、聚类处理。 算法的技术路径表现为4种类型:有监督学习、无监督学习、半监督学习、强化学习。有监督学习是指机器利用已经被训练好的数据,通过找到一个映射函数来映射输入变量X和输出变量Y。有监督学习解决的往往是分类问题和回归问题。分类问题就是指运用有监督学习的算法来预测输入数据点所对应的单一离散变量,也就是某一样本的类别,比如判断种类、职业等;回归问题就是预测连续变量,例如天气预报、物价变动等。 无监督学习则是使用未标记的数据进行训练,其目的是找到数据集的底层结构。无监督学习适用于未标记和未分类的数据,有利于从数据中找到有用的见解。无监督学习往往用来解决聚类和关联的问题。聚类是指将数据对象根据相似性进行分组的方法,主要用来分析、发现数据对象之间的共性。与分类问题的不同之处在于,聚类并不知道输入数据的类别,所以聚类往往应用于客户分群、用户画像中。关联则是面对海量数据对象,主要用来查找数据对象之间的关系,所以关联方法往往用来揭示一系列项目中某一项的概率,表现为某种应用偏好。 半监督学习是指用少量有标签的数据和大量无标签的数据来完成整个模型训练的过程,是有监督学习和无监督学习的结合。半监督学习最常用的就是伪标签技术,也被称为自我训练,就是对已经标注的数据直接训练,然后预测未标注的数据,将预测置信度最高的样本进行标签定义。这就相当于约束了算法模型对无标签的数据对象的搜索空间。 强化学习是指智能体在环境中不断试验,并通过智能体与环境的直接交换,来获得环境给予的反馈,并据此不断调整和优化行为。强化学习没有监督者,是通过从状态到行为的映射来获得最大化的奖励,而奖励反馈又具有延时性。正因如此,强化学习算法往往用来训练对象的步骤目的,即采用什么样的行动可以完成特定的目的或者实现收益最大化。所以,强化学习通常用在探索领域,包括自动驾驶、游戏、自然语言处理等。 不管是何种机器学习方式,算法技术具有5个方面的特征:(1)在输入项必须存在0个或多个数据输入,作为运算的初始情况;(2)在输出项肯定存在一个或多个数据输出,否则为失败的算法;(3)有穷性,即算法设计的流程和步骤是有限的;(4)确定性,即算法的每一步骤如何执行必须是明确的;(5)可行性,即算法中执行的任何步骤都可以在有限的时间内实施。 这5个方面的技术特征,其实彰显了算法就是一种数理逻辑,即把某个问题以数字的方式在模型论、证明论、集合论、递归论等方式中获得确定性。而数理逻辑是形式逻辑的数学表现形式,所以,算法受形式逻辑的同一律、矛盾律、排中律和论证要充足理由等规律限定。于是,算法重视的是形式而不是内容,只能得出“是”与“不是”,不可能存在模糊的“中间地带”,且所有的结果都要有依据,即存在的存在。算法就成为了统计上的“确定性”。算法在经验性事物处理上,具有比人类智能更快的处理效率和更强的问题解决能力。这一重要技术贡献,使得算法成为了生产力革命的重要标志,是推进生产生活智能化的“阿基米德支点”。