大模型赋能万行万业:生态型商业模式

作者简介:
戎珂,清华大学社会科学学院教授(北京 100084);康正瑶,布里斯托大学商学院助理教授;罗怡宁,浙江大学管理学院研究员(杭州 310058)。

原文出处:
中国社会科学评价

内容提要:

ChatGPT的问世标志着大模型时代的来临。尽管人工智能的技术已经取得了巨大的突破,但产业落地和商业化一直面临挑战。如何促进大模型的产业落地、赋能万行万业,成为各界关注的焦点。以生态视角解构大模型产业,大模型产业生态可以分为四个层次:数字基础设施层(L1)、通用大模型层(L2)、行业模型层(L3)和场景模型层(L4)。基于此,构建生态型商业模式,关键在于促进不同生态成员的能力共享和能力组合,核心能力和专有能力的灵活组合将带动大模型赋能万行万业,构建未来的共享经济。


期刊代号:C31
分类名称:创新政策与管理
复印期号:2024 年 04 期

字号:

       引言

       随着ChatGPT的问世和在全球范围的爆火,大模型正在逐渐成为引领技术和产业革命的新兴力量。大模型(Large Model),又称为基础模型(Foundation Model)或通用模型(General Model),属于一种相对较大的人工智能预训练模型。这些大模型采用迁移学习的方法,首先在大规模的公开数据集上进行训练,利用深度神经网络构建出AI模型,随后这些预训练模型可被迁移到目标场景进行微调,并实现应用创造价值。

       从发展历程来看,人工智能的演化已经历经了三个阶段,但是在商业化和产业落地方面似乎一直面临着问题,可以说历经了三次挫折。1956年夏,在美国达特茅斯大学召开了一次关于机器智能的学术研讨会,会上正式采用了“人工智能”这一术语。①尽管人工神经网络的概念可以追溯到20世纪40年代和50年代,但在发展早期由于算力算法等条件都不成熟,这一时期的探索停留在理论阶段。20世纪70年代起,人工智能发展进入第二阶段,第五代计算机的问世带来了算力和算法的进步,但是数据成了主要的障碍,因为不足以计算和积累海量数据,此时与人工智能技术的商业化也有较大距离。直到21世纪第二个十年,人工智能技术才迎来了新一轮发展,这一变革主要得益于硬件技术的进步(如GPU)、算法的优化和大规模数据集的可用性。人工神经网络的演进和深度学习的崛起代表着人工智能领域的重大转变。深度学习作为人工智能的一个子领域,强调训练多层次的深度神经网络。这一技术的兴起为大模型的发展铺平了道路,并成为当今人工智能领域的重要支柱之一。但是目前看来,在商业化方面,由于应用场景和行业知识缺乏的问题,这一阶段人工智能仍未实现大规模商业化运用,也成为亟待解决的问题。

       大模型标志着人工智能发展的一个新阶段。迁移学习作为与大模型相关的关键概念之一,引领了人工智能的新浪潮。在2017年Vaswani等人的论文中,Transformer架构的提出彻底改变了自然语言处理领域的范式。②如BERT和GPT等大模型在自然语言处理领域的卓越表现便是迁移学习的杰出示范。虽然BERT模型在2018年就已推出,模型参数量达到3亿,但这种模型并未像GPT一样大获成功,这涉及算据的重要性。BERT采用的是自监督预训练的模式,而GPT大模型是基于人类反馈的强化学习技术,海量的训练数据为GPT的成功奠定了基础。目前,以GPT系模型为代表的大语言模型(LLM,Large Language Model)是现有大模型的主要组成部分。大规模图像数据集,如ImageNet的出现也为图像预训练大模型提供了数据基础。各类大模型的涌现已经改变了文本、图像和音频内容的生成方式,人工智能生成内容(AIGC,Artificial intelligence generated content)引起了广泛关注,展示了大模型在应用领域的巨大潜力。

       从大模型的发展历程可以看出,尽管起步很早新技术不断涌现,大模型的发展仍历经挫折,特别是商业化应用和应用场景落地困难重重,这是因为前期算力、算法、算据等条件还不成熟,而目前也需要进一步寻找和探索应用场景,解决具体应用场景的问题,创造实际价值真正赋能万行万业。展望未来,尽管大模型的前景光明,但仍面临着一系列的技术挑战,包括计算资源、数据偏见和模型解释性等问题,更需要解决长期以来在商业化落地方面的障碍。在用户端掀起浪潮后,大模型将如何进一步赋能产业,实现商业化落地,带来万行万业的升级与革命?在这个充满机遇和挑战的背景下,本文将聚焦大模型如何商业化这一研究问题,探讨大模型的定义、发展现状以及商业化应用的发展机遇。

       大模型的产业化落地和商业化应用需要培育生态型商业模式,构建大模型产业生态体系。本文首先将大模型产业生态分解为四个层次,包括数字基础设施层(L1)、通用大模型层(L2)、行业模型层(L3)和场景模型层(14)。在这四个层次中,数字基础设施提供了大模型训练和推理所需的基础设施,通用大模型为各行各业的应用提供了通用性的基础构建模块,行业模型通过融合特定行业的数据和特征,提供了更专业化的大模型,而场景模型则进一步细分,专注于解决特定场景或问题的需求。

       基于此,本文提出了生态型商业模式的关键概念。与传统商业模式不同,生态型商业模式由更广泛的生态成员组成,包括通用平台和多元的生态伙伴。生态型商业模式强调能力共享和能力组合,企业不再仅提供单一的产品和服务,而是根据自身优势和禀赋,培育和提供不同侧重的能力,并通过能力的灵活组合以满足各种不同场景的需求。在大模型产业生态中,各级别的生态成员,包括政府、行业协会、数字企业、各行业龙头企业和中小企业等,共同参与,协同合作,构建一个具有开放性和创新性的生态系统,推动大模型在各行各业的应用和发展。本文将探讨如何通过培育生态型商业模式和构建大模型产业生态体系,将大模型的力量充分落地于各行各业,推动全面的数字化转型和智能化发展。

       一、大模型发展的机遇和挑战

       大模型的发展受到多个关键因素的影响,这些因素既提供了机遇,也带来了挑战。

       在算法方面,大模型的发展取得了显著进展,这为各种任务的高效训练和部署提供了新的机遇。新的深度学习架构和优化技术不断涌现,如Transformer架构的提出,极大地推动了自然语言处理任务的发展。这些新算法使得大模型在各个领域中的发展取得了重大的突破,使大模型更加智能。然而,其也带来了进一步的挑战。大模型在运用到各类多元化的应用场景的过程中,需要面向该领域的算法人才的补充和算法技术的进步。为了实现卓越性能,大模型需要更海量的数据和更复杂、精细的算法,实现不断优化迭代。这意味着需要进行更多的专业研究来改进训练算法,同时也需要更多的标注数据,要求持续的大投入、高成本,这对于许多企业来说将成为最大的制约因素之一,特别是资源相对缺乏的中小企业。

相关文章: