司法人工智能时代仍有法学方法论的运用空间吗?

作  者:
雷磊 

作者简介:
雷磊,法学博士,中国政法大学钱端升讲座教授。

原文出处:
法学家

内容提要:

司法人工智能,尤其是大语言模型的诞生及其运用于司法实践的可能,看起来会消除司法裁判中法学方法论的运用空间。司法人工智能的基本原理在于根据历史裁判数据的统计规律预测(生成)当下的数据,但裁判数据的信息处理不等同于司法裁判本身,计算也不等同于推理或论证。从应然的角度看,只要坚守司法裁判作为说理活动的性质,法学方法论就不应丧失其运用的空间。从实然的角度看,在事实认定领域,机器算法因现实认知能力限制和评价余地应对乏力,无法恰当地从证据材料中建构出案件事实;在法律适用领域,机器算法无法替代创造性的法律解释及其诸多方法,也无法进行真正的漏洞填补和法律修正。但语料库语言学在法律解释中的应用,说明数字技术的确为法学方法论带来信息来源和具体运用样态的改变。未来的算法与方法,应当是相互增强的关系。


期刊代号:D410
分类名称:法理学、法史学
复印期号:2026 年 01 期

字号:

  2025年8月26日发布的《国务院关于深入实施“人工智能+”行动的意见》(国发[2025]11号)指出,要“深入研究人工智能对人类认知判断、伦理规范等方面的深层次影响和作用机理”,“探索模型应用新形态,提升复杂任务处理能力”。司法裁判无疑属于需要运用“人类认知判断”和“复杂任务处理能力”的领域。故而一段时间以来,人工智能技术在司法裁判中的运用(下文称之为“司法人工智能”)问题已成为一个热门话题。尤其是以ChatGPT和DeepSeek为代表的大语言模型的诞生,使得司法人工智能的前景看起来一片光明。在传统上,司法裁判被认为是一种将法律适用于个案的活动,即基于说理和论证来衔接规范与事实,从而得出裁判结论的过程。在这种活动中,法学方法论①扮演着至关重要的作用。它是以实在法秩序为基础探求具体问题之规范性解答的过程中遵循的规则、形式、路径及其体系化,旨在提供各种使裁判得到充分说理的论证模型。②但司法人工智能看起来会消除上述图景,因为如果只根据算法,基于历史裁判数据来对当下案件作出裁判,那么也就没有运用法学方法论的必要。事实上,有德国学者已经察觉到现代信息技术对于法学方法论的挑战,并表达过类似的忧虑:如果说法学方法论的特点在于展现了一种作为中间层的精细体系,介于个案决疑与法律规则以及基本规则、基本原则之间,那么对大宗数据的处理程序是否恰好不需要这种精细体系的中间层?③

  本文的主旨在于尝试证明,上述这种忧虑是多余的。对此,下文将首先阐明司法人工智能的基本原理及其缺陷(第一部分),接着从事实认定与法律适用两个方面分别展开具体论证(第二、三部分)。当然,虽然司法人工智能不会消除法学方法论的运用空间,但这并不意味着它不会给法学方法论带来改变(第四部分)。

  一、司法人工智能的基本原理及其缺陷

  (一)司法人工智能的基本原理

  人工智能的基本想法,可追溯至逻辑学家艾伦·图灵(Alan M.Turing)于1950年发表的经典论文《计算机器与智能》。这篇论文试图进一步发展一个早已被哲学家霍布斯(Thomas Hobbes)所提出、并为逻辑学家哥德尔(Kurt Gödel)所证明的主张:推理=计算。由此,形成了后来的人工智能研究者们所共享的一个基本假说:不仅推理可以转化为计算,而且其他种类的“智能”,包括决策、学习、理解、创造等,都可以转化为计算。为了对这个假说进行“科学确认”,图灵提出了一套检验方法,即让一台计算机和一个人分处于两个房间,他们与外界的通信仅限于文字交流,由房间外的人类裁判者提问,他们各自来作答。如果裁判者不能分辨哪个房间里是计算机、哪个房间里是人,那么就可以认为计算机已具备人的智能。④这就是著名的“图灵测试”。而最近,国外的两位认知科学家通过测试证明,大语言模型已通过“图灵测试”。⑤

  “图灵测试”蕴含着这样一种“信息处理观”:一方面,人工智能的研究范围仅限于信息处理。也就是说,人工智能系统所做的一切,都是先由外界提供预定格式的信息,然后对这些信息进行加工处理,再将加工处理后得到的结果表达成预定格式的信息向外界输出。因此,推理、决策、学习、理解、创造等,在人工智能研究中通常只被作为信息处理的具体类型来对待。另一方面,人工智能系统直接关注的外部对象只有人,它与其他外部对象(现实世界中的万事万物)并不直接发生关系,而只能借助于人类与它们发生间接关系,例如在与人的交流中谈到一些事物。这意味着,人工智能系统只拥有关于现实世界的知识(数据),而对现实世界本身一概不管。⑥

  在这一基础上,早期基于预训练语言模型的司法人工智能将开放的司法数据经过自然语言处理后,输入机器学习的算法之中,得出一种或多种用于预测案件胜诉或败诉可能性的模型。与此相比,今天的司法人工智能得到了大语言模型的加持。大语言模型的能力,源于它对海量文本数据中蕴含的“统计规律”的学习和掌握。它可以从数据中学习到词汇的搭配规律、语法的规则、句子的结构、篇章的组织方式,甚至能解读一些常识性的知识和简单的逻辑推理。正是基于这些“统计规律”,大语言模型才能生成自然流畅、语义连贯的文本,与人类进行自然的对话交流。⑦相比于预训练语言模型,大语言模型包含数百亿或更多的参数,因而大幅扩展了模型体量、预训练数据量和总计算量,可以更好地根据上下文理解自然语言并生成高质量文本。它基于神经网络模型而产生,具有小模型不具有的“涌现能力”。⑧但无论如何,任何语言模型背后的基本原理都是相似的,即基于历史数据中出现的语词的概率,预测每个词(句子、段落)后面的下一个词是什么(预测即生成)。这体现在,在预训练过程中,大语言模型通常会采用掩码语言建模(好比“完形填空”)和自回归语言建模(亦即“文本续写”)。⑨这意味着,即便是大语言模型的“智能”也仍然是一种“基于记忆而非理解”的智能,它的知识在根本上是一种“压缩失真”的知识。大语言模型的本质是一场跨越数字与文字维度的转换实验。同理,司法人工智能的目标并非复现法律推理,而是寻找和建立判决中各个数据参数间的相关性。因此,司法人工智能所做的工作无非也是信息处理,即根据历史裁判数据的统计规律预测或者说生成当下的数据。

  (二)司法人工智能的根本缺陷

  但是,根据历史裁判数据的预测不等同于司法裁判本身,计算也不等同于推理或论证。

相关文章: