一、引言 2024年下半年以来,人工智能大模型领域突飞猛进,特别是杭州深度求索人工智能基础技术研究有限公司(DeepSeek)发布的DeepSeek-R1推理模型,展现了高效的推理能力。DeepSeek通过采用高效的混合专家(mixture of experts MoE)模型,并通过稀疏激活机制在不显著增加计算成本的情况下,大幅减少了网络的参数量,降低了模型的存储需求和计算开销。创新的多头潜在注意力(multi-head latent attention,MLA)机制,与之前普遍应用的多头注意力(multi-head attention,MHA)机制相比,所需显存仅为MHA的5%~13%,并加快了推理过程。DeepSeek还通过多token预测技术(multi-token prediction,MTP)更好地理解上下文从而增强了泛化能力。 DeepSeek除了大幅度降低部署和应用成本外,还展示了强大“思维链”能力,通过自解释推理路径和多步逻辑推演,实现了从现象分析到结论生成的完整认知闭环,将人工智能推进到“链式推理驱动”的新阶段。本文针对DeepSeek带来的强大逻辑推断能力,结合应用大模型处理大批量结构化数据的痛点和难点,构建代码逻辑+大模型推导的双引擎智能分析系统,并以财政支出智能分类和违规“三公”支出智能挖掘两大场景为例探索实践效果,通过实践应用论证双引擎智能分析架构的特点和价值,同时也分析当前不足和进一步优化方向。 二、结构化数据应用大模型的困难 习近平总书记指出,做好新时代新征程审计工作,总的要求是在构建集中统一、全面覆盖、权威高效的审计监督体系,更好发挥审计监督作用上聚焦发力,具体要做到如臂使指、如影随形、如雷贯耳。要做到“三如”的要求,离不开大数据的分析和应用。审计法第三十四条明确,审计机关有权要求被审计单位按照审计机关的规定提供财务、会计资料以及与财政收支、财务收支有关的业务、管理等资料,包括电子数据和有关文档。第三十五条明确,国家政务信息系统和数据共享平台应当按照规定向审计机关开放。这些条款为审计机关获取数据提供了法律支撑。2021年以来,上海市审计局积极落实市委审计委员会年度工作要点要求,联合上海市大数据中心共同推进审计监督主题库的建设,通过不断开展企业审计板块、财政审计板块、行政事业审计板块的系统建设,形成市大数据中心归集的本市公共数据和审计自有数据综合应用的格局,形成社保、工商、行政处罚等十几类主题数据,为审计业务持续赋能。以审计采集的财政数据为例。为全面深化预算制度改革,财政部进行了预算管理一体化系统建设,用系统化思维构建现代信息技术条件下“制度+技术”的管理体制和机制,切实提高财政资源利用效率。该系统数据作为政府财政活动的核心载体,全面记录了预算单位三级指标明细、国库支付及非税收入等关键信息。此类结构化数据不仅为宏观层面分析政府收支规模、结构与执行效率提供多维透视基础,更能依托预算管理规则构建动态监测模型,通过智能筛查异常支付模式、超范围支出或非税收入异动等问题线索,精准定位预算执行偏差与潜在违规行为,在提升预算执行透明度、强化财政监督效能方面发挥了重要作用。 大模型可以直接对结构化数据开展分析应用,即依托政务大模型私有化部署的安全环境,通过低代码交互界面如DeepSeek-R1等平台,采用“附件上传+提示词驱动”的模式。用户上传包含记账凭证的Excel等数据,并输入“筛查三公支出违规行为”等自然语言指令,由模型解析后返回分类结果与推理依据,这种模式在处理小数据量时可以取得较好效果。但在面临大量数据处理需求时,仍存在以下技术瓶颈: 一是模型输出与数据完整性的冲突。大语言模型基于概率生成范式,其本质是对输入数据的语义重构而非确定性映射,这一特性与结构化数据处理的字段级精准性要求存在根本矛盾。以财务凭证数据为例,当模型对科目编码“5001\02\17”公务接待费科目进行合规性推理时,可能因注意力机制偏差或训练数据中的噪声干扰,错误地将原始科目及编码改写为“5001\02\11”差旅费,或错误处理金额数值,如将“12,500.00元”输出为“125,000.00元”。更隐蔽的风险在于模型可能对摘要字段进行语义等效但形式变异的输出,如将“某单位年度接待专项经费”简化为“接待费”,导致原始业务场景信息丢失。此类非预期篡改将直接割裂数据溯源链条,使得审计人员无法通过模型输出反向定位原始凭证条目,进而引发合规性判断依据失真。假设批量处理5000条凭证,即使模型字段篡改率低至0.5%,仍会导致25条关键违规线索被掩盖或误标,削弱审计结论的可靠性。这一矛盾其实是生成式模型在结构化数据高保真处理场景中的内生性缺陷。 二是大规模数据处理的效果不可控性。大语言模型的推理效能受限于其固有架构缺陷。首先,上下文窗口长度约束迫使长序列数据被强制分割为片段输入,导致跨片段语义关联断裂。其次,注意力机制的位置编码衰减效应引发条目级推理偏差,尤其在处理中间位置条目时,模型对科目编码与摘要的语义解析精度显著降低。在模拟实践中发现,当单批次处理超过100条凭证时,末端条目错误率较首部条目显著上升;这种不可控性暴露出生成式模型在批量化、高密度结构化数据处理中的稳定性缺陷。 三是人工介入的操作冗余性。为规避模型输出篡改与效果波动风险,直接应用大模型需依赖人工干预才能实现数据闭环管理。该流程包含多重低效环节:首先,审计人员需将原始数据集按模型承载上限(如每批次300条)进行人工切割,并通过交互界面逐批上传Excel附件并编写提示词,单次操作平均耗时数分钟;其次,模型返回的结果需经人工校验字段完整性、重要字段是否被篡改,再通过脚本工具进行跨批次数据拼接,此过程易因批次间时间戳错位或ID字段丢失引发数据关联断裂;人工复核往往难以实现全量覆盖,抽样校验比例不高会导致隐性错误持续积累。如需要处理10万条支付记录,每次300条需拆分为334个批次处理,而错误率会因批次间推理标准漂移。如不同操作员对提示词的微调不断叠加,这种“半自动化”模式不仅使审计周期延长,更因人工成本激增削弱技术应用的规模经济性,与数字化审计所需的实时监控、全量筛查目标形成矛盾。