一、引言 2024世界智能产业博览会上,习近平总书记指出:“人工智能是新一轮科技革命和产业变革的重要驱动力量,将对全球经济社会发展和人类文明进步产生深远影响。”①以数据、算法、算力为核心特征的大模型(“大语言模型”的简称,Large Language Model)已经具备了捕捉复杂语义关系,并开展类人语言交互的能力。大模型的出现,不仅意味着技术层面的自动化升级,也意味着以“语言”为基石的人类文化将以新的方式被重组与传播。从语料训练、词语接龙到内容输出,大模型运转的每一个环节都在提取与再造人类既有的文化知识,并以其生成能动性重构人类的文化经验。然而,现阶段大模型的发展以技术攻关为核心,对文化数据实行不加辨别、全盘皆取的拿来主义,使得大模型发展偏重工具理性,而忽视人文内涵。此外,全球大模型格局呈现美国引领的发展态势,技术霸权与文化霸权深度绑定,加剧了全球性的文化失衡。本文认为,中国若要在数智时代确保文化自立与创新,就需推进“文化大模型”建设,这既是推进文化数字化进程的内在要求,也是参与全球文化竞争的重要战略。当前,文化大模型建设已经蓄势待发,却缺少学理层面“为何建设—如何建设—怎样负责任、可持续建设”的系统性梳理。因此,本文尝试厘清以下关键问题:(1)文化大模型建设的必要性为何?(2)文化大模型与国家文化数字化战略相嵌合的建设思路为何?(3)如何应对文化大模型建设进程中产生的风险,规制路径为何? 二、战略背景:文化大模型建设的三重必要性 大模型,作为一项带领人类进入“强人工智能时代”的科技硬技术,似乎自诞生那刻起便与软性的文化格格不入。然而,当人工智能开始全方位地渗入人类的文化和社会生活,其擅用与善用,都呼唤更多人文力量的参与。2023年9月,高书生在文化大模型开发应用大会上指出,联创文化大模型并不是赶时髦,而是维护意识形态与文化技术保障,是实现文化传承智能化的内在要求,更是实施国家文化数字化战略的必然结果。②由此可见,建设文化大模型,在宏观国家战略层面、中观技术发展层面、微观资源连通层面,均具有必要性。 (一)从“新技术”到“新基建”:技术垄断呼吁自主研发 人工智能作为第四次工业革命的核心力量,正深刻重塑全球地缘政治经济格局。③而大模型作为人工智能技术的基础操作系统,正在快速渗透各行各业,重构传统社会分工,推动产业生态的全面升级。在关于人工智能是福是祸的探讨中,人们容易陷入海德格尔所言的“流俗”的技术认知,即认为技术本身是无罪的,关键取决于人的使用。④然而,技术绝非单纯的手段,而是构造世界的目的。换言之,所有因技术特性被卷入的手段,都是为了服务于技术缔造者企图建立的世界。数字技术与资本力量的合谋,将演化为支配人并重塑人的现实力量,蕴含不可忽视的意识形态属性。⑤今天,大模型在知识生成和价值传播中的独特作用,使其成为强有力的“文化软实力”载体。经由数据训练、算法设定与内容输出的控制,技术开发国家与技术标准制定者得以逐步强化自身的文化影响力,同时削弱其他文化价值的可见性。尤其是在全球化与跨文化交流日益密切的当下,大模型可能演变为新的文化霸权工具,加剧弱势文化的边缘化。因此,在全球大模型竞争中,我们必须警惕大模型的“技术垄断”进一步催生“数字独裁主义”与“文化帝国主义”,使技术介导的地缘文化风险成为挑战全球文化多样化格局的新变量。 当前,全球大模型竞争形成“美国领先,中国紧随,其他国家滞后”的格局。中美两国在大模型发展策略上呈现两种走向——工程师文化浓厚的美国专注于基础技术与理论,致力于通用大模型的研发;而我国则更注重模型的场景化与商业化,聚焦推进“行业大模型”。“行业大模型”一般由“通用大模型”微调而形成,虽更具应用性,但不可否认其技术门槛较低、竞争能力弱,极易因底层通用大模型的迭代而被迅速淘汰。美国在基础模型研发、数据底座建设、公共算力规模等方面的优势正在建立一种“人工智能特权”,促使其他国家的研究人员将其研究成果更多地应用于商业领域,而难以接近技术核心。2025年以来,以DeepSeek、阿里巴巴为代表的中国顶尖AI公司发展势头迅猛,其通用大模型智能能力显著提升,极大地缩小了我国在通用大模型领域与美国的技术代差。然而,受限于算力基础设施、芯片性能、数据利用率等方面的差距,美国仍持续主导着全球AI产业链。 大模型主导权的旁落,何以威胁文化主权与意识形态安全?其一,行业大模型有赖于通用大模型作为技术底座。美国在通用大模型领域的技术优势与性能优势,易使后续的行业大模型开发者青睐于选择美国的通用大模型作为基础。API调用等非本地化接入方式可能使得千行百业的数据落于他手,导致独立可控的文化防护体系难以建立。其二,OpenAI等科技巨头正试图构建一个统治全球的大模型操作系统及应用接口。随着GPTs(用户定制的AI助理)的推出,用户与AI平台的链接愈发紧密,成为大模型获取数据的节点。通过大模型的广泛应用,一条贯通行业与用户的全链条数据利益体系正在成型。依托这一链条,跨国科技巨头不仅能主导内容生产,还能通过价值输出影响行业与用户的自主性,进而深度干预意识形态与价值观念的塑造。 数字文化主权,是主权国家对其政权管辖范围内的数字文化数据享有的生成、创作、传播、控制、利用、保护等权力,是国家最高权力在文化数字化领域的外化。⑥当前,美国在大模型技术与应用市场上的先发优势使得我国的数字文化主权面临数据外流、技术依赖、文化内涵受外部价值入侵等挑战。打破大模型领域美国主导的“赢者通吃”局面,我国必须积极推进“主权人工智能”建设,以维护“数字文化主权。主权人工智能指以国家力量支持人工智能基础设施建设,以本国文化、价值、思维数据训练人工智能模型,并形成贯穿本地行业上下游的人工智能生态系统。⑦本文认为,文化大模型,是”主权人工智能”在数字文化领域的具体实现形态,其根本目的是以中华优秀文化资源赋能通用大模型、行业大模型、场景大模型的建设,在数字文化领域形成独立安全、自主可控的人工智能生态系统。由此,文化大模型的建设应当具有三重内涵。第一,应统筹整理、合理开放中华优秀文化数据资源,建设具有中国文化内涵的通用大模型底座;第二,应鼓励各类文化事业、产业单位聚焦特定领域定制行业大模型,助力文化资源保护、连通与转化;第三,应根据特定应用场景设计场景大模型,创造人民喜闻乐见的文化空间与文化产品,助推文化新业态的形成。