比例原则在预测警务中的法律规制适用研究

作  者:
邓志 

作者简介:
邓志(1979- ),男,湖南警察学院副教授,法学博士(湖南 长沙 410138)。

原文出处:
中国人民公安大学学报:社会科学版

内容提要:

在数字技术的助力加持下,我国公安机关探索发展了颇具时代性的预测警务实践。然而,与之直接相关的议题研究并不充分,亟须对其实践展开深刻检视。经由分析预测警务实践的运行机制,发现其具有歧视性、不透明性及极强的主动性等特征,而前述争议性特征可能会进一步导致预测警务实践产生诸多比例失衡现象,譬如因数据使用的主观偏见而导致目的偏差、因数据应用程序黑箱导致手段失准以及因数据应用侵权致使权益保障失衡。鉴于此,在预测警务实践中通过创新性地引入比例原则,从而为平衡公共安全与权利保障提供一种理论自洽与实践适配的诠释方案:首先,旨在弘扬数字正义,可以通过引入被遗忘权以确保预测对象平等;其次,为了保证预测手段必要,增强算法程序的公开化和透明化程度,建构跨部门数据共享平台;最后,遵循最小侵害原则,推动主体监督模式向高级合作协同维度进阶、完善相关的问责追责机制。


期刊代号:D8
分类名称:公安学
复印期号:2026 年 01 期

字号:

  一、问题的提出

  因现代科学技术的迅速发展以及人类行为对自然不断产生的影响,各种不确定的因素严重威胁人类的生存与发展[1]。为此,在警务领域,国家应用预测警务应对风险,①并且取得显著成效,成果丰硕[2]。2023年,全国公安机关共立刑事案件数、查处治安案件数较2019年分别下降12.9%、9.7%,其中爆炸、杀人等8类严重暴力刑事案件数下降10.7%,每十万人命案发生数为0.46起,全国盗抢骗案件立案数较2019年下降31.4%,全国拐卖案件数较2019年下降66.6%;2024年,全国刑事案件同比下降25.7%;我国是世界上命案发案率最低、刑事犯罪率最低、枪爆案件最少的国家之一[3]。

  但是,现阶段预测警务实践应用并不完全成熟,在其为公民提供更安全的生活环境的同时,也引发了一定的价值冲突。一方面,预测警务可能威胁个体的平等权,导致受标记个体受到不公平对待;另一方面,可能侵犯公民的人身自由权、隐私权和个人信息保护权,带来实践过程中侵权的风险。这些问题的根源在于公权力在利用先进技术进行犯罪预测与防控时,存在过度干预私权领域的倾向。而比例原则,作为一项在法治国家中占据核心地位的法律原则,旨在调和公私法益间的冲突,确保实质正义的实现[4]。鉴于预测警务中存在公权力过度干预私权领域的风险,而比例原则恰能对权力行使进行规范与约束,确保公权力在追求犯罪防控目的时,具有协调矛盾的重要功能。本文将根据预测警务的运行机制,探讨预测警务目前存在的争议性特征,从而准确识别现阶段预测警务实践存在的主要问题及其症结。通过细致分析预测警务实践的现实状况,进一步发掘这些问题与比例原则适用存在的关联意义,进而针对其中的失衡现象提出相对合理的比例原则动态适用范式。

  二、预测警务的运行机制及其争议性特征

  预测警务的运行机制是利用机器学习,②基于特定场景反复发生暴力犯罪的历史数据,以及犯罪时空、人员等特征因素,形成用于预测的学习算法,并结合警力资源的优化配置,开展犯罪主动防控[5]。根据预测警务的运行模式,可知预测警务在实践过程中具有一定的歧视性、不透明性以及极强的主动性。

  首先,预测警务具有一定的歧视性。其一表现为现状偏见。预测警务利用机器学习,而机器学习与AI本质上是基于过去的决策学习算法从而进行预测性工作。一旦过去关键性因素发生变化,AI就无法很好地预测不同类型的未来行为;Fikfak和Helfe进行了一项针对JURI Says算法模型的实验,验证了这个结论。该模型在全新事实场景下对违规预测能力存在显著局限性,仅准确预测了59.1%已事先沟通案例[6]。这表明在预测警务领域,当面对全新场景时,预测模型的准确率可能仅达59%。此种情况下,表面上看警方需承担41%的误判风险,但实际风险可能被严重低估。因为在预测警务系统中,任何一次误判都可能产生100%的负面效应。当系统错误排除潜在危险时,将导致执法资源调配失当,使公民面临未被预警的安全威胁;而当系统错误标记无辜者时,则可能引发过度执法和对公民权利的侵害。

  其二表现为选择偏差。选择偏差的产生源于机器学习算法高度依赖已生效的司法判决、罪犯服刑记录、治安处罚决定书以及公民信用档案等大数据进行训练。但是,受各类因素影响,并非所有大数据都能被纳入机器学习的算法训练数据之中。各类因素包括:1.各环节工作人员的失误。机器学习算法的大数据来源非常广泛,涉及多个部门。若是某个部门工作人员失误遗漏某个数据,影响了关键因子,便会导致整个预测结果失准[7]。2.应当登记而未登记的案件。诸如偷盗私有主体、侮辱诽谤他人等非公诉案件,若双方选择私下和解或者施暴方威胁恐吓受害方而未向相关部门报备,这类事件便无法纳入正式的违法犯罪数据统计体系。这样便会使违法犯罪数据不全面,导致预测结果存在偏差。3.工作人员的主观判断也可能造成部分数据的遗漏。例如,对于一些看似犯罪动机是正义的违法犯罪行为或是未成年人的不当行为,警务人员可能会基于个人情感或社会观念而未将其纳入统计范畴。这将导致算法模型在训练过程中无法有效捕捉被过滤数据中隐含的特征变量,使预测结果系统性偏离真实风险分布。

  其次,预测警务具有不透明性。预测警务实践运行主要依靠机器学习算法,利用大数据进行预测性分析。传统算法范式具有固定模式,即每个算法均存在输入与输出环节:数据输入计算机后,算法依据既定设定对数据进行处理操作,最终得出相应结果。以EdgeRank为例,Facebook平台上数量庞大的用户帖子构成其数据来源,Facebook的程序员运用代码编写的算法,能够决定每个帖子在特定用户新闻源中的预期排序,而输出的结果则是用户看到的这些帖子按照相应规则呈现的排名[8]。倘若某些关键因素发生变动,程序员就必须手动对代码进行编辑。从本质上来说,这一过程其实就是程序员手动编写用以支持预测的规则。然而,步入现代,机器学习的出现促使程序员的预测方式发生了范式变革。在机器学习模式下,程序员只需向算法明确想要预测的目标,并为算法提供相关数据,算法便能够自行确定生成预测的规则。故而,在依托机器学习算法的警务领域,预测模型输出具有不透明性,其可能会犯程序员未预料到的错误。这些错误从程序员没有写的、无法解释的规则中出现。此类错误的产生可能侵犯公民的基本权利。更为棘手的是,由于这些错误无法直接归咎于程序员,也难以对其进行责任追溯。

  最后,预测警务具有极强的主动性。通过预测警务的运行机制对各类违法犯罪行为进行主动预控,可以判断预测警务属于一种典型的主动性警务治理,契合现代风险社会的基本理念[9]。传统行政法秉持着“管得最少的政府就是最好的政府”的理念,将行政权界定为“守夜人”的角色,以消极行政为主要特征。进入现代风险社会后,当公民个体无法面对现代社会不可预期的巨大整体风险时,国家作为一般意义上社会秩序的维护者和社会资源的掌控者自应强力介入,排除或减少危害,满足公民的合理预期[10]。但与此同时,这种介入在一定程度上促使行政权力迅速扩张。在警务领域,为实现危险的前置性防控,执法人员凭借机器学习被赋予了采取预防性强制措施的权力。在技术赋能下呈扩张趋势的行政权,使传统法律框架下的权力制衡机制面临新的挑战。并且,由于预测警务本身具有不透明性,公民通常只能被告知机器学习对警务预测活动的影响的结果,甚至有时候根本不会被告知。警方在整个过程中始终掌握主动权。也正因如此,警方工作人员的部分行为,其合法性可能面临质疑与挑战。此特征存在争议性,即是因为在预测警务的主动实践过程中,公民的隐私权、人身自由权、知情权等基本人权,均面临遭受侵犯的风险。一方面,在这种情况下,公民往往处于被动接受的地位,难以有效维护自身权益。另一方面,警方的预测结果都基于概率,在将概率性结果推定为事实的背景下,概率被当作执法证据[11]。例如,无罪推定要求在依法被证明有罪之前个人将被视为无辜。然而,机器学习算法评估存在固有缺陷,其预测模型的误差率可能引发侵权风险。当算法将无辜个体错误标记为高风险对象时,这可能会导致警方依据预测结果对没有犯下任何罪行的人采取预防措施,从而危及公民的基本权利,而公民只是被动接受此预测结果。此种先于司法程序的预判机制不仅违背无罪推定原则,更可能通过持续的监控、盘查等手段对公民人身自由权造成实质性侵害。

相关文章: