一、问题的提出 随着信息、网络技术的迅猛发展,大数据、人工智能越来越广泛地应用于各个行业。刑事诉讼处于国家与犯罪作斗争的最前沿,刑事侦查更应该充分利用科技发展带来的技术红利,提高侦查人员侦查破案、调查收集证据的能力。以美国为代表的域外国家大都重视利用大数据、人工智能的最新成果提高警方侦查和控制犯罪的能力。 近年来,我国也开始注重利用大数据、人工智能提高预防和打击犯罪的能力。然而,从总体上看,我国公安机关对大数据的运用主要侧重于已然之罪,即利用大数据查找已经发生的犯罪的实施者,如利用大数据视频技术侦查犯罪、利用人脸图像数据库抓捕犯罪嫌疑人等。而对于未然之罪的预测和防范,也即预测警务的关注严重不足,对作为预测警务制度基石的数据收集与管理、算法设计与审核等问题都缺乏必要的顶层设计。学界也一直没有将预测警务作为重要的研究课题。 为推动预测警务在我国的发展,本文拟对预测警务在域外国家的产生与沿革进行深入考察,剖析其制度机理,研究其可能存在的风险,尤其是对公民权利可能造成的损害,在此基础上,对预测警务在我国的推行与规范提出建言与设想。 二、大数据预测警务的运作机理 警方控制犯罪能力的高低不仅取决于其在犯罪发生后准确查明犯罪事实的能力,在很大程度上也取决于其在案发前准确预测犯罪的能力。然而,在大数据时代到来之前,警方预测犯罪的能力非常有限。有学者将大数据时代之前的犯罪预测方法称为“临床法”,这种预测方法建立在个体的直觉、经验等主观判断的基础之上,不受预先设定的已识别变量的控制。 大数据时代的到来使这一切发生了改观。由于收集和处理数据的能力大幅提升,大数据时代的预测更多地建立在客观数据和科学方法的基础之上,这种预测又被称为“精准预测”,其机理是“考察客观的、机制性的、可重复的预测因素,通过实证研究方法对这些预测因素进行选择和验证,并将其运用于被量化的已知结果”。 作为一种精准预测的大数据预测警务大约发端于20世纪90年代。虽然起源时间相对较晚,但迄今为止已经历几次较大的代际更迭。美国学者安德鲁·格思里·弗格森将大数据预测警务的发展概括为三个阶段:预测警务1.0阶段、预测警务2.0阶段和预测警务3.0阶段。支持这三个阶段的理论基础有所不同,这三个阶段的预测能力存在明显区别,与此同时,这三个阶段所引发的问题也不尽相同。 (一)大数据预测警务1.0阶段 大多数学者认为,真正开启大数据预测警务1.0时代的是美国洛杉矶警方。洛杉矶警方与几所主要大学的研究机构进行了一项实验:使用一种预测算法对三种财产犯罪进行预测:入室盗窃、汽车盗窃和车内财物盗窃。实验取得了成功:在实验开展的最初6个月内,入室盗窃罪下降了25%。 大数据预测警务1.0与后文将要考察的大数据预测警务2.0之所以能够取得较为普遍的成功,关键在于这两个阶段的预测警务都有较为深厚的犯罪学理论作为支撑。犯罪学早期一个较为成熟和著名的理论是社会解组理论。该理论认为,“集中于特定地点的经济劣势与其他社区层面的分裂变量交织在一起,减损了诸如家庭、教堂和学校等社会组织对社区成员,特别是年轻人施加影响的能力”。基于这一认知,社会解组理论认为:“‘地点’和‘方位’,也就是空间位置比其他任何个体特征与犯罪的相关性都要强。”总之,犯罪学理论揭示出一个重要事实:犯罪与环境因素有着非常紧密的联系,特定的环境漏洞是导致犯罪的重要原因,这成为大数据预测警务1.0和大数据预测警务2.0的重要理论基础。 (二)大数据预测警务2.0阶段 如果说大数据预测警务1.0还停留在对财产犯罪的预测上,那么大数据预测警务2.0就将对犯罪的预测扩展到暴力犯罪。一般认为,与财产犯罪不同,暴力犯罪的发生在地理学上更为随机,因而对暴力犯罪的预测会更为困难。然而,犯罪学的研究表明,暴力犯罪同样会受到地理环境因素的影响,因而对暴力犯罪的精准预测也是完全有可能的。例如,犯罪学理论认为,特定的环境漏洞可能是暴力犯罪的重要诱因:有些小巷可能因为灯光昏暗、有便捷的逃跑路线以及更为接近受害群体等原因更加吸引抢劫罪犯;有些酒吧可能因为酒精混合物、毒品以及夜间判断错误等原因更容易诱发暴力斗殴。 比较分析大数据预测警务1.0和2.0不难发现,两者除了适用范围有所不同之外,其预测依据也存在差别。大数据预测警务1.0还无法摆脱对过往犯罪活动相关数据的依赖,甚至可以说主要是建立在过往犯罪活动的数据基础上的。而大数据预测警务2.0则“使用一个地点的地理和环境属性来预测未来的犯罪,并不依赖于该地区过去犯罪活动的相关数据”,因而被认为是“真正的预测警务”。但是,大数据预测警务1.0和2.0也存在一些本质上的相同之处:首先,二者遵循的基本逻辑是相同的,即某一地区存在的特定的环境漏洞可能诱发犯罪,进而导致该地区发生犯罪的风险升高;其次,无论是大数据预测警务1.0还是2.0,都不会对某一具体犯罪作出预测,而只会对犯罪的风险值作出预测。