来源期刊

刊名：管理科学

主办单位：中国人民大学书报资料中心

期次：2026年01期

大模型商业应用挑战及其管理对策：基于知识增强的应用框架

引用| 收藏 |打印|下载word

作　　者：

金旭磊

作者简介：

金旭磊，黄丽华，张成洪，复旦大学管理学院（上海 200433）；陈刚（通讯作者），复旦大学管理学院副研究员，博士，研究方向：大模型结构化推理，E-mail：chengang050970@foxmail.com；肖帅勇，同济大学经济与管理学院（上海 200092）。

原文出处：

工程管理科技前沿

内容提要：

大模型产业发展迅速，其技术创新与广泛应用推动了企业的数智化转型，带来了显著的商业价值。大模型得到了政府与社会各界的重视，党中央、国务院多次强调了人工智能技术在我国高质量发展中的重要作用。2023年以来，我国大模型产业迅速增长，大模型技术日渐成熟。然而，企业在应用大模型的过程中，除了遇到模型性能的问题，还会面临人员与组织管理等方面的难题。现有关于大模型的研究多聚焦于技术层面，缺乏商业管理视角的综合分析。本文通过调研四家实施大模型的企业，探讨了大模型商业化应用中的挑战与需求，并提出基于知识增强的大模型商业应用框架，为企业实践提供参考。

期刊代号：C3

分类名称：管理科学

复印期号：2026 年 01 期

关键词：

大模型商业应用框架案例分析　　large language model framework for commercial application case analysis

字号：大中小

　　引言

　　近年来，大语言模型（large language model，LLM，“大模型”）产业发展迅猛，自ChatGPT发布以来，大模型在各行业的生产实践中发挥了重要作用，推动了企业数智化转型。据Statista统计，2023年全球大模型市场规模已达300亿美元，预计到2028年将增长至700亿美元，展现出广阔的市场前景。2025年的《政府工作报告》将“支持大模型广泛应用”列为政府工作任务之一，反映出国家对大模型产业的高度重视。在政策与市场的共同驱动下，国内外大模型技术持续演进。2025年初，深度求索公司发布了开源大模型DeepSeek-R1，通过强化学习提升了推理能力，并利用混合专家架构降低了训练成本。同年3月，Monica推出基于多智能体架构的Manus AI，能够自主完成报告撰写、数据分析与行程规划等复杂任务，展现了大模型的应用潜力。与此同时，OpenAI发布的O3系列大模型在推理、多模态处理与工具调用方面实现了突破，进一步拓宽了大模型的应用边界。

　　随着大模型技术持续进步，大模型的商业应用也在加速拓展，已在客户服务[1]、内容生成[2]、教育培训[3]、金融分析[4]和医疗诊断[5]等领域展现出应用价值。大量的应用实践表明，领域适应性是影响大模型应用效果的关键因素[6]。目前，企业主要通过三种模式实现大模型的领域适应：（1）提示工程[7]（prompt engineering，PE）通过设计提示词来引导大模型生成内容；（2）检索增强生成[8]（retrieval-augmented generation，RAG）利用外部相关文档与知识来提升生成结果的准确性与专业性；（3）监督微调[9]（supervised fine-tuning，SFT）与人工反馈强化学习[10]（reinforcement learning from human feedback，RLHF）通过深度注入领域知识，提升大模型的领域理解与任务执行能力。

　　然而，尽管现有应用模式提升了大模型的领域应用效果，但在大模型商业化应用过程中仍面临诸多挑战。例如，大模型在用户意图识别准确性、响应内容可控性与生成结果可靠性方面仍存在不足，特别是在医疗等高风险领域，企业对输出结果的可解释性提出了更高标准。此外，领域大模型部署对企业的算力资源、数据资源、专业人才储备和组织协同能力也提出了较高要求。因此，企业需要系统性的应用框架，统筹技术能力与组织资源，确保大模型在复杂商业环境中的高效应用，实现大模型的商业价值转化。

　　1 文献综述

　　1.1 大模型技术原理

　　随着人工智能技术的发展，以深度学习为代表的技术创新推动了大模型的兴起[11]。大模型通常指参数规模达到亿级的神经网络模型[12]。凭借出色的泛化性能，大模型已广泛应用于自然语言处理（NIP）、计算机视觉、数据分析与决策支持等领域[13]。

　　大模型的发展经历了从基础神经网络到复杂网络架构的演进。早期，循环神经网络[14]和长短时记忆网络[15]推动了深度学习在NLP领域的发展。2017年，Vaswani[16]提出Transformer架构，以自注意力机制高效建模序列数据，极大地提升了模型性能，催生了BERTE[17]、GPT-3[18]、DeepSeek-V3[19]等大模型，这些大模型在自然语言理解与生成任务中展现出了卓越能力。随着应用需求的扩展，研究者提出了CLIP[20]、DALL-E[21]、Stable Diffusion[22]等多模态大模型，使模型能够同时处理不同模态数据，满足更复杂的应用场景。

　　大模型训练的核心在于大规模神经网络设计与高效优化策略，参数规模的扩大增强了模型对复杂特征与模式的理解与表达能力[23]，而高效的训练策略兼顾了降低资源消耗与挖掘大模型潜力[19]。为提升大模型领域适应性，学界提出了多种技术路径。基于SFT[9]和RLHF[10]的策略组合，增强了模型输出与人类偏好的对齐程度。提示工程通过设计提示词引导高质量输出[7]，思维链[24]通过显式推理路径增强了模型的逻辑推理能力与可解释性。针对计算资源消耗问题，以DeepSeek[19]为代表的基于混合专家架构的大模型，通过门控机制动态激活少量专家网络，有效降低了训练成本。此外，RAG[8]通过检索知识库或文档提升模型回答的准确性与专业性。多智能体系统[25]则通过多个Agents的协同工作，提高了复杂任务处理能力。

　　总体来看，随着深度学习技术的持续演进，以及高效训练策略和多项创新技术手段的应用，大模型的性能和通用性显著提升，应用范围不断扩大，已成为当前人工智能研究与实践的重要方向。

　　1.2 大模型应用模式

　　大模型在自然语言理解与生成能力上的持续进步，推动其应用场景不断扩展[26]。在通用任务方面，大模型在自然语言处理、图像理解与多模态协同等方面实现了重要突破[27]。通过学习海量数据中的复杂模式，大模型能够灵活生成符合用户需求的个性化文本、图像与视频[2，28]。在问答系统中，大模型可以直接进行问题响应，能够支持智能助理、客户服务助手等多种场景[1，29]。在跨模态理解方面，大模型能够统一建模文本、图像与音频数据，完成多模态生成任务[30-31]。同时，大模型在数据分析与决策支持方面也展现出强大能力，能够高效处理结构化与非结构化数据，挖掘潜在数据模式，辅助商业决策[32-33]。

共9条结果上一页12 3 4 5 下一页全部展开

综合集成研究的历史发展

顾基发

管理科...2026年第03期
数据系统工程：数据资源与数据产业

杨善林

管理科...2026年第03期
风险冲击下韧性供应商选择与订单分配问题研...

王新玉

管理科...2026年第03期
竞争性线上零售商的店内广告合作策略研究

蓝永泉

管理科...2026年第03期
基于时空图注意力网络的食品供应链数字化改...

周伟华

管理科...2026年第03期

来源期刊

大模型商业应用挑战及其管理对策：基于知识增强的应用框架

相关文章：