一、引言 2025年政府工作报告提出要加快培育包括具身智能在内的未来产业。党的二十届四中全会通过的《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》强调要前瞻布局未来产业,推动具身智能等成为新的经济增长点。当前,人类社会已经步入数智时代,人工智能作为引领新一轮科技革命和产业变革的重要力量,是大国竞争的战略制高点。在人工智能领域取得先行者优势才能掌握更多话语权,为实现国家长治久安、增进人类福祉奠定坚实基础。相较于传统人工智能,具身智能实现了从数据到行为的跃迁,具备类人化的感知、认知、决策及执行一体化能力,能够与真实物理世界交互且不断学习进化,为通用人工智能的实现提供了更加可行的路径。加快发展具身智能,亟须推进其产业化,只有通过产业化形成完整的研发—制造—应用闭环,才能真正将具身智能转化为现实生产力,释放经济社会价值。 具身智能被认为是实现通用人工智能的基本途径,[1]但目前尚未引起学界的广泛关注。当前大量文献从理论和实证层面对人工智能进行了深入研究。理论层面,学者们较早尝试通过经济增长模型解释人工智能对经济增长的影响路径及其效果。[2,3]实证层面,基于工业机器人数据的诸多研究表明,人工智能会显著提升劳动生产率,[4]但劳动替代效应和就业创造效应使得人工智能对劳动力就业的影响尚存争议,[5,6]还有文献证实人工智能在创造更多财富的同时可能会加剧收入不平等。[7~9]然而,工业机器人并不能代表具身智能,其与具身智能存在本质区别,工业机器人通常依据预设程序执行任务,不具备自主学习进化和适应多变环境的能力。 当前学术界对具身智能的研究,大多基于哲学和传播学视角从技术层面讨论具身智能的可行性和必要性。[10,11]具身智能与离身智能最大的区别在于其具有可区分性和可控制性的“身体”,“身体”赋予机器人感知、空间、交互和情感四大核心能力。[12]从“具身”视角看,只有消除心、身二元论思维,彻底摆脱传统人工智能的计算—表征思路,具身的人工智能体才具备可行性。[13]对于是否有必要发展具身智能应辩证看待,[14]但要重点进行包括具身智能本体、交互及应用等维度的安全治理。[15]若对具身智能的研究仅停留在技术层面而非产业层面,就难以释放其技术红利和创新价值,只有推进产业化,才能推动科技创新转化为经济社会效益。 具身智能产业隶属于未来产业范畴。现有文献对未来产业的驱动力量、[16,17]成长路径与范式、[18]对新质生产力的促进作用等进行了充分探讨,[19]但未来产业囊括生物制造、量子科技、6G等诸多类别,每一类细分产业特征不同、路径有别,对其进行聚焦研究才能够提供更有针对性的实践指南。具身智能是一种基于物理实体进行感知和行动的人工智能系统,通过与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性,[20]人形机器人和智能汽车广义而言都属于具身智能。具身智能产业则是指围绕具身智能技术体系所展开的技术创新、产品化、商业化等活动的集合,当前这一产业尚处于形成期,需加快使其进入成长和成熟阶段,才能牢牢把握住产业发展主动权。 总体而言,既有文献对具身智能进行了诸多探索,为后续研究提供了有益借鉴,但仍存在以下不足:一是对人工智能特别是工业机器人的研究丰富,但对人工智能的新浪潮——具身智能的前瞻性研究不足;二是少数以具身智能为主题的文献,仅停留在技术研究层面,尚未基于经济学视角进一步考虑其产业发展问题;三是当前有关未来产业的研究略显宽泛,缺乏针对具身智能产业的深入研究。鉴于此,本文将在系统研究具身智能产业发育逻辑的基础上,深入剖析具身智能产业不同发展阶段面临的差异化需求,有针对性地提出加快发展具身智能产业的实践路径,以推动具身智能产业高质高效发展。 二、具身智能产业发育及其内在逻辑 具身智能产业发育是供给和需求相互作用的结果。人工智能和机器人技术的深度融合提供了供给侧的技术推动力量,农业、工业、服务业等领域智能化需求的日益增长形成了需求侧的市场拉动力量,供需两侧相互作用使得具身智能产业的发育成为必然。同时,推进具身智能产业化并按照产业发展规律给予差异化支持,是加快释放新质生产力潜在动能的必然要求。 1.技术推动:人工智能和机器人技术深度融合的必然趋势 经过70余年的发展,人工智能取得了诸多重大突破。1950年,计算机之父图灵提出图灵测试,1954年第一台可编程机器人诞生,1966年世界首个聊天机器人ELIZA发布。1950~1980年间,人工智能始终基于符号主义进路发展,符号主义即认为智能就是通过抽象的符号计算实现。1982年和1984年,物理学家霍普菲尔德发表了两篇关于人工神经网络的研究论文,产生巨大轰动。深度学习之父辛顿受此影响开始深耕人工智能领域,于2004年设计出神经计算与自适应感知模型,成为90%以上人工智能应用的底层模型。1981~2010年间,深度学习推动人工智能向通过算法模拟神经元组织的联结主义发展,但并未拓展到硬件层面,仍局限于模仿大脑对信息处理的部分功能。2011年至今,AlexNet深度卷积神经网络模型和ImageNet机器学习数据集的出现加快了人工智能的发展进程。2018年OpenAI发布第一代GPT模型,这一生成式人工智能展现出强大的理解、推理和创造能力。数据的井喷式爆发和深度学习的迭代使人工智能进入蓬勃发展期,但其发展进路仍然与身体无涉、与情景无关,所联结的平台和载体可以被剥离,本质上依旧是一种离身智能。 现代机器人技术始于20世纪50年代。1959年,Unimation公司制造出世界上第一台可编程的工业机器人,并于1961年安装在通用汽车生产线上,标志着工业机器人技术的诞生和现代机器人的开端。机械制造和触觉传感器技术的飞速发展使得工业机器人的运动能力和灵活性不断增强,但大量工业机器人只适配单一场景,仅能处理单一任务。1980~2010年间,视觉、力觉、触觉传感技术迅速融合发展,丹麦乐高公司推出可实现个性化拼装的机器人套件,iRobot公司开发出可自动避障并设计路线的Roomba吸尘器机器人,但其仍无法进行深度思考。2011年至今,可行走跳跃的Atlas双足人形机器人、能够进行简单语言交互的Sophia女性人形机器人、面部表情细腻的Ameca模块化人形机器人相继出现,人形机器人在情感识别、语言理解、社交互动等方面取得显著进展,但如何让机器人能够更加类人化,在广泛的知识、任务、场景领域内展现出高度的自适应性和反馈机制,成为核心困难。