论具身智能的意识形态属性

作  者:
温旭 

作者简介:
温旭,复旦大学马克思主义研究院副教授(上海 200433)。

原文出处:
教学与研究

内容提要:

具身智能是依靠物理实体通过与环境交互来实现智能增长的技术系统,其开发应用已超越单纯技术范畴,在价值导向、认知建构层面展现出鲜明的意识形态属性。从技术逻辑看,具身智能以感知、决策和行动的交互闭环为核心,深度渗透生活场景,演化为兼具技术中介性与价值传导性的意识形态载体;从传播机制看,其依托具身性在场体验,将身体转化为传播媒介,实现信息高效传递与意识形态隐性规训;从运作样态看,其推动意识形态呈现出具身式规训、聚焦式运行、沉浸式渗透三大特征。在具身智能发展与应用过程中,需将主流意识形态融入其运行逻辑:技术上通过数据校准夯实价值根基、算法对齐把控决策方向、交互赋能创新传播路径,实践中以场景化浸润、多模态交互释放效能,牢牢掌握具身话语权,筑牢国家意识形态安全屏障。


期刊代号:G2
分类名称:思想政治教育
复印期号:2026 年 02 期

字号:

  新时代以来,新一轮科技革命和产业变革加速演进,人工智能发展日新月异。具身智能是“依靠物理实体通过与环境交互来实现智能增长的智能系统”①,是当前人工智能创新发展的崭新形态。党和国家高度重视具身智能发展与应用,党的二十届四中全会强调,“推动量子科技、生物制造、氢能和核聚变能、脑机接口、具身智能、第六代移动通信等成为新的经济增长点”②。作为具备动态适应与持续学习能力、覆盖多元应用场景的智能形态,具身智能的技术演进与场景落地不仅关乎经济增长动能,其开发训练与场景应用已超越单纯技术工具范畴,其算法设计的价值倾向、数据训练的意识形态偏差、交互传播的隐性规训,使其成为影响主流意识形态建设的新变量,成为意识形态交锋的新阵地,“这个阵地我们不去占领,人家就会去占领”③。本文旨在通过深入分析具身智能的意识形态属性,精准洞察意识形态经由具身智能进行价值传导的机制与样态,为掌握具身话语权、巩固主流意识形态主导地位提供学理支撑。

  一、具身智能中具身话语权的价值引导机制

  作为人类社会实践的技术产物,具身智能既具有辅助人类活动的工具属性,更通过具身话语权的运作,在技术应用的价值导向、主体认知的建构乃至社会规则的塑造中隐性彰显意识形态属性。习近平指出,“话语的背后是思想、是‘道’”④,这一论述同样适用于具身智能领域,其传递的不仅是技术功能,更隐含着通过交互渗透的价值导向。所谓具身话语权,是指特定社会主体依托具身化的智能交互载体,通过实体互动、场景沉浸式体验等具象方式,主导意识形态传递方向、影响人类价值认知与实践行为的隐性权力。具身话语权的作用方式为隐性嵌入,通过数据训练中的价值编码、算法决策中的行为引导、交互场景中的情感共鸣,让用户在无意识层面接纳特定价值导向。具身智能的价值引导功能,核心并非其自身具备自主意识并生成意识形态,而是人类通过算法设计、数据训练、场景设定等关键环节,将特定价值导向植入智能体,使具身话语权借助感知、决策、行动的技术链条落地,最终让具身智能成为传递意识形态的技术载体。

  (一)感知层:具身话语权在多模态感知中价值引导的技术嵌入

  具身智能感知层的多模态整合,并非单纯的技术拼接过程,而是深度融入意识形态属性的价值建构过程,更是具身话语权在技术源头展开争夺的关键领域。这一环节的核心逻辑,是通过感知系统的技术设计,将具身话语权转化为可落地的技术规则,贯穿多模态数据的采集、处理与融合全链路。

  第一,数据采集阶段参数预设实现具身话语权初始分配。具身智能“把自然定义为信息处理的对象”⑤,通过集成摄像头、麦克风、触觉传感器等多类型感知设备,构建起覆盖视觉、听觉、触觉的多模态感知网络,将物理世界的自然信息转化为可处理的数据信号。但在这种感知与数据处理过程中,传感器对信息的筛选与呈现并非客观中立的机械操作,而是受参数预设的价值导向主导。这一过程的本质是具身话语权的价值编码,参数设定实则是将抽象价值偏好转化为可量化的技术标准。这种从参数预设到权重分配的价值传递,印证了具身话语权初始分配的核心特征。它并非数据采集环节的孤立行为,而是通过技术规则的层层嵌套实现。参数预设先嵌入传感器采集规则,再渗透到数据初步筛选规则,最终将特定价值偏好转化为贯穿数据全链路的隐性秩序,使具身话语权从数据源头就完成价值锚定,为后续环节的价值传递奠定基础。

  第二,数据处理阶段信息筛选规则实现具身话语权规则化嵌入。在具身智能多模态数据处理全流程中,数据处理是衔接数据采集与分析决策的关键环节,其核心信息筛选的算法选择与参数设定,直接决定具身话语权的规则化落地。算法类型的选择本质是对数据价值优先级的话语权分配,其背后天然承载预设价值导向。这种基于算法选择的价值倾斜并非主观臆断,而是通过场景导向与算法匹配的定向逻辑实现。算法参数的动态调整是对价值倾向的量化强化,通过精细设定技术参数,可将具身话语权的规则化嵌入从定性描述升级为可落地的定量标准。当这些技术规则与预设的意识形态导向深度契合时,具身话语权便不再是抽象的价值理念,而是通过规则化的筛选逻辑,完成在数据处理环节的深度嵌入,为后续分析决策环节传递价值适配数据奠定基础,确保具身话语权的价值导向贯穿数据全链路。

  第三,数据融合阶段数据偏差推动具身话语权固化。具身智能通过技术手段,将文本、图像、传感器感知等多模态数据整合至统一意义理解框架,实现数据语义的一致性解读。这一融合过程并非无偏差的数据整合,而是受人类价值干预与算法被动学习双重影响,最终通过数据偏差推动具身话语权的固化。其中,人类在数据融合前对多模态数据的语义标签定义与选择,本质是为具身话语权预设价值判断框架,通过为特定行为数据赋予带有价值取向的语义标签,直接引导融合过程向预设价值方向倾斜。在数据融合执行环节,具身智能的底层算法会依据人类预设任务目标,动态调整各模态数据权重;若训练数据中带有特定价值取向,算法会被动学习这一取向,通过提高此类数据的权重,使融合结果显化出与预设价值一致的偏向性。这种算法被动学习并放大价值取向的本质,是特定主体的具身话语权借助数据偏差,转化为智能体融合逻辑中的固定规则,最终实现话语权在感知层的固化。

相关文章: