张玉洁：智能量刑算法的司法适用：逻辑、难题与程序法回应

论文精粹

近期热点文章

论文精粹|INFORMATION

管理员发布时间：2021-09-22 15:23 点击：2355

近年来，“同案不同判”“案多人少”一直是我国司法实务界关注的核心问题之一。加之错案对司法权威的深刻影响，人们对刑事量刑的规范性、公正性的质疑之声越加严厉。当法官处理案件的数量过多，那么该法官在单个案件上所花费的成本与心力就将减少，“案多人少”就有可能增加错判风险———毕竟法官需要审理的案件太多，而个人受到年度考核压力的影响，结案率是一项（相较于司法公正）更具备可观测度的指标———由于错判风险增加的感性认识，“同判不同判”就成为裁判不公正的典型特征。实际上，“案多人少”是一个数量问题，而非质量问题。数量上的压力并不必然导致质量低下。因此，以“案多人少”为由来解释“同案不同判”，其解释效果并不具备强大的说服力。细察司法实践可以发现，“案多人少”并非近些年来的特殊现象，但直到近些年人们才关注到“同案不同判”难题。究其背后的原因，中国裁判文书的公开化、可检索化才是人们指责“同案不同判”的关键证据。这是因为，裁判文书公开、可检索，便利了人们监督司法裁判，以提升法官裁判的公正性。但公众对司法裁判的监督，恰恰折射出司法裁判本身固有的特征：依法独立裁判。换句话说，当A法官裁判时，只需要依据法律（以及相关司法解释）来作出判决，而无需关注本法院其他法官的裁判、其他法院同类案件的裁判、其他省份同类案件的裁判。但中国裁判文书公开、可检索却不同。当事人、律师以及检察官都可以检索到同类已决案件的裁判结果，并与待决案件裁判结果加以比较，以此为证据来批判“同案不同判”。由此观之，非徇私枉法意义上的“同案不同判”不是一个“法官过错”，而是整个司法职业的裁判成本。但社会公众并不因此就能够接受这套说辞。为此，国家一直在采取更加彰显公正、量化公正的方式来解决这一难题。

为了解决上述局面，“量刑建议”就成为刑事司法领域一项独特的解决方案。刑事诉讼法第176条与第201条甚至试图在审判机关与检察机关之间，通过“量刑建议”的方式来提升量刑的规范性———至少两个专门性法律适用部门均认可的量刑结果，比一个部门作出来的量刑结果更具备规范性和说服力———由此为解决“同案不同判”提供了一种新的思路。然而，“量刑建议”如何高效地建立审判机关与检察机关的默契，以及如何高效地提出规范化的量刑结果，本身仍在探索过程中，并且似乎由于权力配置差异未必能完全达成一致（例如：浙江台州蔡某危险驾驶认罪认罚案件）。为此，司法机关便试图从“高效”理念入手，来解决量刑中的“同案不同判”以及“案多人少”问题。例如，2005年《人民法院第二个五年改革纲要》提出“建立和完善案例指导制度”，试图通过“指导性案例”参照适用的方式，来解决同案不同判问题。其中，第24号指导案例的大量司法应用实践表明，这一路径在疑难案件上确实在一定程度上解决了“同案不同判”难题。但这一解决路径仍难以满足“高效”要求。为此，2017年《最高人民法院关于加快建设智慧法院的意见》提出以人工智能、大数据等高科技手段促进法官“类案同判和量刑规范化”，解决“同案不同判”“案多人少”问题。上海、海南等24个省市司法机关已开始向现代科技寻求解决之道。例如：上海利用“案例数据+算法”等科技手段研发的“刑事案件智能辅助办案系统”，便是一项极富司法创新意义的勇敢尝试。这类系统能够根据行为人的量刑情节、犯罪行为特征以及社会危害程度等要素，快速为法官提供量刑建议。1

但是，“量刑建议”只是一种委婉的表达，其背后蕴含的是传统司法的结构性转向：从传统司法迈向智慧司法。作为“智慧司法”的核心组成部分，“智能量刑算法”已经成为传统司法结构性转向的关键节点。因此，智能量刑算法的司法定位就成为国家必须予以回应的法治议题之一。目前，世界各国普遍认为，由于智能量刑算法自身在定分止争功能、暗箱决策、算法歧视等方面的缺陷，它只能作为法官裁判的辅助工具加以使用。2但实际上，定分止争功能发挥、暗箱操作、人格歧视也常常被认为是人类法官裁判的弊端。由此观之，目前学界和实务界对智能量刑算法的认知，在某种程度上走入了一种“技术无知”的误区。为了客观展现智能量刑算法的司法价值，笔者将法官裁判和算法裁判的竞技场，限定为智能量刑算法已能够解决的“普通的简单案件”———疑难案件裁判既非智能量刑算法的强项，也非其当前的研发目标———并借助多种智能辅助量刑系统的实践运作、相关案例以及司法数据，来还原智能量刑算法的客观样态及其真实司法难题。笔者的研究将表明，在“同案同判”的要求下，智能量刑算法同法官之间，仅是裁判逻辑上的差异，而不存在功能上的分歧。而智能量刑算法所附带的法律难题，只是传统司法结构性转向过程中的阶段性缺陷。这些缺陷也将通过“技治主义”程序建构而得到改善。

一、智能量刑算法的司法逻辑

自1989年我国研究“电脑量刑系统”起，3中国司法就开启了智慧化变革之路。历经2006年山东某基层法院“电脑量刑”软件系统、42017年上海“刑事案件智能辅助办案系统”的多次变革，我国司法机关逐步实现了从传统司法向智慧司法的结构性转变。然而，排除司法体制改革等政治因素的考量，是什么推动了中国司法的巨大转变？学者们将其视线聚焦于人工智能科技的发展，即大数据技术、深度学习算法以及人工智能相集成的产物。这些技术不仅推动了中国的司法变革，也对西方国家的司法改革产生了深远的影响（如美国COMPASS量刑系统、澳大利亚SIS量刑系统、荷兰PSG北极星求刑系统等）。因此，中国司法转型也被视为人工智能科技发展浪潮的一个缩影。然而，就近30年的智慧司法转型之路而言，重要的不是人工智能科技如何影响、推动了中国司法的发展，5而是人工智能科技在1989年、2006年智能量刑试验受到猛烈抨击之后，为什么能够在司法领域生存下来，甚至在多个国家得以正当运行。着眼于后者，“人工智能科技的发展”的理由过于牵强，且难以回应基本司法原理———司法公平、正义、平等等价值理念———的质疑。因此，对智能量刑系统的认识，必须回归智能量刑系统的核心构造（智能量刑算法）及其基本司法逻辑上来，才能探求到中国“智慧司法”改革的成功秘诀。

（一）算法裁判的主体性逻辑

智能量刑系统在司法领域的运用，已经成为一个不争的事实。但围绕这一事实所引发的主体性讨论，却是当前司法界以及人工智能学界颇具争议的难题。传统上，司法裁判历来都是法官（或者说“人”）依法行使的权力，不受行政机关、社会团体和个人的干涉。这一点，不仅在我国宪法第131条中规定，而且在各种司法学说上也得到了证实。6因此，当前对智能量刑算法的定位，一般划归为辅助性量刑工具。这是因为，学界普遍认为当前的刑事司法（乃至整个司法裁判系统）仍然是以法官审理、质证、裁判为核心的，并且每一个环节离不开法官的主观判断。即便智能量刑算法能够以“输入-输出”的机械形式形成量刑结果，法官对该结果的准确性、可适用性依然具有“把关”义务。因此，相较于法官而言，智能量刑算法只能是辅助性的，尚无法做到依法独立裁判。然而，当下的辅助性定位不仅是狭隘的，而且是有悖于司法发展规律的。从智能量刑算法研发、应用的初衷可以发现，司法机关采用人工智能量刑就是为了解决“案多人少”“同案不同判”问题。前者致力于将法官从繁重的简易案件中解放出来，后者则致力于简易案件的“同案同判”———某种意义上，疑难案件因为自身的疑难性而“同案不同判”，也具备了正当性、合理性———故此，司法发展规律本身即是通过标准化、智能化的裁判要素筛选，确定出简易案件裁判的核心要点，并基于此要点作出标准化、量贩式裁判；同时希望法官同简易案件割裂开展，而将有限的法官、有限的司法资源投入到疑难案件的审理中去。然而，智能量刑算法的出现，彻底打破了以往司法裁判主体单一化的局面，算法裁判正确率甚至比法官、律师等专业人士更高。多次算法裁判和人脑裁判的竞赛测试结果显示，算法裁判的准确率已经远高于人脑裁判。例如，人工智能算法对584个涉及基本人权的司法案件进行裁判，有79%的案件裁判结果，与欧洲人权法院的裁判结果相同。另有21%的算法裁判结果出现分歧。这是因为智能算法发现了法律与案件之间的微妙差异。而在另一起测试中，英国研究人员安排智能算法与100名律师共同检查保险合同案件。结果，智能算法以86.6%的准确率领先于律师的66.3%。7甚至在另一起“保密协议”审查比赛中，人工智能算法的审查准确度达到95%，远高于律师85%的审查准确率。8也就是说，在简单案件裁判的准确率上，智能量刑算法已经足以胜任“法官”的角色。

唯一的问题在于：智能量刑算法在刑事审判过程中，究竟是“独立裁判者”还是“量刑辅助工具”？法学界认为，目前智能量刑算法的局限性远大于其功用。例如：目前该系统仅能对90余个简单的、可量化的罪名（如盗窃罪）发挥比较大的作用，且充斥着暗箱决策、算法歧视等严峻风险。因此，“量刑辅助工具”被视为智能量刑算法最为稳妥的司法定位，“独立裁判者”的主体性定位为时尚早。然而，严峻的风险尚未造成严重的司法损失，学术界的担忧也未获得实证层面的支撑。至少截至目前，关于智能量刑辅助系统算法歧视、暗箱操作的实例尚未出现。即便美国威斯康星州诉卢米斯案中涉及“罪犯矫正替代性制裁分析管理系统”（Correctional Offender Management Profiling for Alternative Sanctions，简称“COMPASS”）的算法黑箱、算法歧视风险问题，亦未证明算法风险确实引发了量刑失范后果。因此，对智能量刑算法的苛刻与否定，或许只是法学界选取参照系上的不经意失误。

当我们将焦点转至整个社会治理体系时，关于“独立裁判者”还是“量刑辅助工具”的争论，又将转化为“是否允许法官之外的智能算法获得裁判权”的疑问。实际上，当裁判权被置于整个社会治理体系之中时，它立刻被弱化为一种纠纷解决机制。而且在整个社会治理体系中，除了以法官为基础的法律纠纷解决机制之外，还存在宗族公约、民间习俗、行业惯例等非正式纠纷解决机制。其中，法官与宗族长辈、调解人、仲裁人具有同样的功能（即解决纠纷），只不过法官是由国家法律创设的一种制度性中立者，它依赖国家法律和强制力保证自身的权威性。由此观之，法官裁判权相比宗族公约、民间习俗、行业惯例的优势在于：其裁判主体身份是法定的、以国家权威作为后盾的，并且，这些优势是后天（法律）赋予的，而非先天获取、后天不可变更的。

由于智识发展程度与社会需求的变化，传统司法想要维持“法定秩序”，就必须持续性地提升法官裁判能力和裁判权威，并同时降低非正式纠纷解决机制（例如偷亲戚的钱、打伤邻居等行为，偶尔不纳入刑事公诉中）的替代性威胁。在非正式纠纷解决机制在未发生明显变化的情况下，国家要么付出更高的人力、物力成本，以达到持续提升裁判权威的目的；要么从法官裁判能力入手，着力推进法官职业共同体的整体水平。由于司法资源的有限性以及裁判权威持续性提升的双重压力，提高司法成本对保障裁判权威而言已经收效甚微。而以“案例指导制度”为代表的制度改革路径，以及以“智慧司法”为典型的技术改革路径，就成为我国“提升法官职业共同体的整体裁判能力”的必然之举。其中，前者着力解决“立法漏洞”（低概率纠纷）的同案同判；后者则以“智能量刑系统”为标志，致力于高发、简单案件的同案同判。既然智能量刑系统在技术上可行，那么为了解决“案多人少”“同案不同判”问题，司法机关就有动力接纳智能量刑算法的主体性定位，以提升司法裁判的控制力。

为了更为清晰地证明智能量刑算法的主体性定位，在此不妨先行否定其主体性定位，并模拟“量刑辅助工具”下的司法裁判过程。当法官面对一起简单案件，其只需要依据丰富的裁判经验来快速找到刑法条文并确定量刑结果。即便是裁判经验不丰富，也不会被简易案件所难住———否则该案件就不是一起“简易案件”了——唯一的问题在于，在每一年度中，法官们总是需要耗费大量的时间成本和精力，用于解决这种低难度的简易案件。9而且，在将智能量刑算法引入司法裁判之后，每一起简易案件需要经历两次“裁判”：法官裁判和算法裁判。并且，法官裁判结果还必须接受算法裁判结果的检验。倘若两种结果相一致，不仅证明了法官裁判结果的正确性，更证明了通知量刑算法作为“独立裁判者”的可行性；倘若两种结果不一致，那么法官不仅需要证明自身结果的正确性，还需要证明算法裁判结果的错误。对于简易案件而言，“完备的上诉程序”以及“极低的错判率”似乎能够更加经济、高效地解决法官错判问题，而无需花费巨额费用来研发和适用智能量刑算法。由此观之，“量刑辅助工具”意义上的智能量刑算法，不仅未能在简单案件中解放法官，甚至给法官裁判增加一道程序或者一项任务。而作为“独立裁判者”的智能量刑算法，却能够为整个法官职业共同体节省大量的时间成本和精力，从而将有限的司法资源用于疑难案件的裁判。故此，智能量刑算法在当下虽然是辅助性的，但其趋势必然是主体性的。而且，在前述客观数据的印证下，智能量刑算法可能是一种优于法官的“同案同判”者。由此，智能量刑算法对传统司法的主体性调整，便不再是一种侵犯法官独立裁判权的表现，而是社会、经济、文化智能化变革的必然选择。只是智能量刑算法的“独立裁判”身份，仍需要建构一系列的衔接程序。

（二）算法裁判的量化规范逻辑

现行刑法体系是以“罪名”与“刑事责任”为基础建立起来的一整套渐变序列的惩罚机制，并且每一个罪名都对应着特定的刑事责任。因此，刑事裁判的技术核心就在于如何有效地建立案件事实与罪名之间的逻辑关系，并据此量化出相应的刑事责任。根据司法实践，我们可以将传统的刑事裁判活动假想为一种拼图过程。在这一过程中，法官的左手握有已经成型的拼图模板（即“罪名”），右手则是零散的拼图模块（即“各种有效的案件事实”）。法官的任务则是观察松散“事实”模块，并寻找出一个最相近的“罪名”模板，然后将“事实”模块拼成“罪名”的模样。值得庆幸的是，由于罪名的有限性，法官寻找拼图模板并非难事；又因为大多数犯罪活动的相似性，“事实”模块的种类也不至于繁多到无以复加。由此，法官的拼图过程实际上就是“定罪”的过程，而事实模块的碎裂化程度则决定了量刑的高低。然而，“定罪”结果可以由“罪名”模板加以验证，量刑的准确性却因人而异，无从验证。不同的法官也由于裁判能力、裁判经验以及情绪等因素的影响，10无意识地造成了“量刑”不公正、不规范。因此，传统刑事司法的“拼图”裁判模式无法真正回应“量刑规范化”的时代需求。

上述假想虽然是杜撰的，但结论却是真实的。法官在刑事司法裁判过程中，受到人类检索能力以及智识水平的影响，只能够采用“笨拙”的拼图模式来确定“事实”与“罪名”的关联性，进而完成每一次的个性化“量刑”。但这种裁判模式的弊端极其明显，即每次量刑都是相对独立的、不累及其他案件的司法活动。这无疑造成了法官“同案不同判”“量刑不规范”的后果。只不过这一后果在传统上被“法官裁判”的制度话语所掩盖了。但中国裁判文书的全面公开，让“拼图”裁判模式的弊端暴露无遗：同类案件并没有实现同样的裁判———至少没能做到量刑的统一化———这样，“法官裁判”的权力配置虽然仍能够对抗行政机关、社会团体和个人等主体，却无法合理地解释“同案不同判”“量刑不统一”问题。至此，为了改变“量刑不规范”问题，司法机关必须在有限“罪名”模块与有限“事实”模块的基础上，寻找到“量刑规范化”“量刑可验证”的解决方案。而智能量刑算法对于刑事司法裁判的意义恰在于此。

就我国刑事司法裁判而言，智能量刑算法延续了传统刑事裁判的“拼图”模式，但由于司法大数据以及智能算法的支持，量刑的可验证性得到了明显提升。这主要是由于智能量刑算法的“量化规范逻辑”。所谓“量化规范逻辑”，是指智能量刑算法以司法大数据为依托，将已生效刑事判决中的“案件事实”“罪名”“刑事责任”等定罪量刑要素模块化，并根据不同模块影响定罪量刑的程度来设定量化值（算法初始值）。每一起待决案件的裁判均需要经受司法大数据（尤其是相似案件）的反复验证。可以说，算法裁判的基本逻辑，是从大量相似数据中获得比较性结论。其逻辑起点并非刑法条文，而是大量的已生效判决。当然，对刑法条文的背离以及对已生效判决的遵从，极易受到法律经验主义的抨击。尤其是在成文法国家，这种裁判逻辑可能改变刑法条文的立法边界，扩张、限缩甚至扭曲立法原意。因此，智能量刑算法的量化规范逻辑只能限定为功能性描述（即“其他相似案件也这样判”），而未掺杂任何价值判断。

（三）算法裁判的经验规范逻辑

在追求“法治统一”的情况下，人们为何还要明确区分依法裁判和算法裁判？“法治统一”就以判决结果的一致性来论，岂不更加简单明了？对此，司法实践给出的解答是：依法裁判和算法裁判在说理方式上明显不同：前者只以法律为依据，追求法治过程与法治效果的统一；后者只注重“统一”的效果，而没有以法律为依据。“经验”才是智能量刑算法得出裁判结果的依据。而且，算法裁判的经验成份越多，法律成份就较少，判决结果的合法性程度也较低。为此，以智能量刑辅助系统为代表的算法裁判，因为缺乏足够的法律成份，而成为更具经验色彩的裁判方式。

然而，法律成份的减少，并不意味着算法裁判正当性的减弱。实际上，就裁判活动而言，“法律”构成法官依法裁判、算法裁判共同的宏观规范指引———这种指引是强制性的———而“经验”又构成法官裁判、算法裁判共同的微观操作指南。差异则是因二者在经验运用方式与运用程度上有所区别。当法官衡量刑事案件与法律规则之间的关系时，刑法条文给予法官的裁判支持是非常有限的。例如，在一起故意伤害致人死亡案件中，法官通过刑法条文无法直接判断被告人的主观要件。因此，法官往往必须借助证据、犯罪行为、犯罪后果等客观要件，来推测被告人的主观要件。11当法官尝试在客观要件与主观要件之间建立客观联系时，刑法条文的规定便不再那么重要，怎样实现“主客观相一致”才是案件裁判的核心难题。由此，该法官必须借助以往裁判经验以及法官职业共同体的集体智慧，来寻找这一核心难题的微观操作指南。受到法官依法裁判的影响，这种微观操作指南可能有很多种。但究竟哪一种操作指南更为便捷、高效，则需要法官自己筛选，结果也未必能尽如人意。幸运的是，大数据技术的发展，让微观操作指南的类型化构建得以简便，而算法则成为微观操作指南的精准运作指令。

经由上述分析可以发现，算法裁判与法官裁判之间并没有明显的界限。无论是法官的人工式经验筛选，还是智能量刑算法的大数据式经验筛选，在本质上只是筛选效率和经验适用强度的差异，而非裁判依据的根本性改变———法律始终构成智能量刑算法裁判结果的核心依据。但当我们将案件范围限定在普通简单案件范围时，算法裁判相较于法官裁判的优势就彻底显现出来了：其一，智能量刑算法能够增强“同案同判”的可操作性。流程化的算法裁判方式能够将简单案件中的各种定罪、量刑要素加以分析、计算，裁判结果也能够同已决案件进行比对，“同案同判”效果也将更加显著。其二，智能量刑算法的适用能够提升简单案件的形式正义。由于算法裁判的结果是以“违反《XXX法》第X条规定的”的方式来呈现的，而其推理过程则是以经验性比较方式来促成的。因此，算法裁判是在无损实质正义的基础上，为形式正义增加了“经验比对”的关卡，有助于保证算法裁判的正当性。其三，智能量刑算法真正解决了“案多人少”问题。目前，基层法院审理的大多数刑事案件，属于简单案件。利用智能量刑算法，基层法院能够高效地解决掉数量最多的“简单案件”，从而将有限的司法资源投入其他疑难案件中去。当然，算法裁判的误判弊端也难以遮盖。即便是简单案件，算法裁判也需要符合被告人的个案公正诉求。否则，即便算法裁判的实施效果远高于其运行成本，它也无法获得社会公众的认可和适用。对此，智能量刑算法无法在技术层面加以解决，只能寄希望于制度层面的优化完善。

二、智能量刑算法的司法适用难题

智能量刑算法的司法适用，给传统刑事司法裁判带来了巨大挑战。既然上海、海南等省市已经开展相关的试点工作，那么，从理论探讨到司法实践的整体反思，就成为智能量刑算法必须接受的考验。结合当前的司法实践与社会反馈可以发现，智能量刑算法的可接受性难题、周延性难题、“系统性偏差”难题已经成为司法实务界以及社会公众共相关注的问题。为此，对智能量刑算法司法适用难题的探讨，也将以此为核心展开。

（一）算法裁判的可接受性难题

从传统刑事司法到智能量刑系统的时代变革，之所以被认为是刑事司法应对“同案不同判”“量刑不规范”难题的必由之路，是因为诸如量化裁判、经验智慧之类的司法行为，本来就是刑事司法的基本逻辑，并且例证俯拾皆是。例如英国的“普通法”、美国的“量刑指南”。12但智能量刑算法的量化裁判之路，当下却难以为社会公众所接受。其背后的主要成因是智能量刑算法对社会公众传统司法认知的冲击。例如，社会公众希望通过司法裁判感受到“公平”“公正”“正义”以及“良知”等基本道德理念，而不是大数据、人工智能、统计学、概率论等机械判断。但细品之下就会发现，这个理由是难以成立的。尽管智能量刑算法舍弃了不可验证的道德概念，却并未减损司法裁判的实质公正性。那么，在不接受智能量刑算法的情况下，社会公众可否选择其他的纠纷解决机制？答案也是否定的。结合刑事司法实践可以发现，“公平”“正义”等目标是众多纠纷解决机制的共同目标，但唯有法律纠纷解决机制在刑事纠纷上具备强制性，且保证了“人人平等”———这两种要素是非正式纠纷解决机制所不具备的———因此，即便当事人（及社会公众）无法接受智能量刑算法的裁判，也不可能超越刑事审判而选择其他纠纷解决机制。既然如此，对于“智能量刑算法难以被社会公众所接受”这一命题，真正有意义的提问是，智能量刑算法与传统法官裁判的差异性是否值得重视？

在传统刑事司法下，虽然社会公众接受刑事审判是被迫的，但对审判的结果却是认可的。由此可以推知，无论被判定有罪或者无罪、罪轻或罪重，刑事案件被告人均信任刑事裁判的最终结果。当前智能量刑算法不被接受的症结恰恰就在于此，即被告人不信任智能量刑算法。导致不信任的法律原因有两个方面：一方面是智能量刑算法减弱了刑事司法的“亲源性”特征。无论是调解、仲裁等非正式纠纷解决机制还是法律纠纷机制，历来强调当事人与中立者的某种渊源关系。它既可以通过血脉、社会交往、口传身受等方式来建立，也可以依靠共同信仰、外部权威而形成。总之，中立者必须获得当事人双方（或多方）的认可。但是，智能量刑算法恰恰缺乏了传统司法的“亲源性”特征———至少在智慧司法改革中，司法机关尚未尝试科普一下社会公众与智能量刑算法的“亲源”关系———致使社会公众不了解智能量刑算法的运转原理。这势必导致社会公众与智能量刑算法之间的紧张关系，并诱发智能量刑算法不被社会公众接受的难题。另一方面，智能量刑算法减少了法官和当事人的案件“亲历性”。亲历性构成传统司法的重要特征，并在一定程度上支撑起司法裁判过程的程序正当性。司法的“亲历性”特征要求，法官、检察官与被告人“亲历案件审理的全过程，而不仅仅是案件审理的几个片段”。13但由于社会公众并未参与过智能量刑算法的研发和调试过程，致使社会公众不了解智能量刑算法的运转原理，甚至怀疑智能量刑算法“暗箱操作”，由此导致了公众的不信任、不接受。而且，在智能量刑算法的介入下，刑事司法开始从“审理者裁判、裁判者负责”转变为“法官审理、算法裁判”。由此，当事人在算法研发调试阶段与刑事裁判阶段的司法亲历性均有所减少。受到知识储备不足以及直观感受不佳的双重影响，社会公众对智能量刑算法的不接受，便成为当下司法转型期的一种必然现象。当然，“知识储备不足”可以通过科学知识普及来改善，“直观感受不佳”也能够通过裁判结果来修正。而如何制度化地提升智能量刑算法的可接受性，就成为当前司法转型必须解决的问题。

（二）经验归纳的周延性难题

从社会治理的角度来看，法律规则只是众多纠纷解决机制之一，而且是针对类似、高发案件所预设的解决方案。当法官采用法律规则解决某种纠纷时，必定面临法律抽象性与纠纷复杂性的双重压力。经由一般到特殊的“演绎推理”方法，就成为法官优先采取的纠纷解决方法。故此，传统司法面对刑事案件，总是倾向于采用“演绎推理”的方式，来表达法律、事实以及裁判结果上的逻辑联系。而且，由于演绎推理是从一般规则到特殊事实的推理方法，它既能够遵从一般规定，又能够关照案件的特殊情况。因此，“演绎推理”往往因高准确率和维护“个案正义”，为法官和当事人所信赖。而这恰恰是以归纳法为基础的智能量刑算法广为诟病之处。通常情况下，智能量刑算法的形成，依赖的是大量同类案件的归纳、整理、分析与总结。因此，它一方面保留了归纳法的经验性优势，另一方面也承继了归纳法不周延的弊病。简而言之，智能量刑算法遵从了归纳推理方法，从众多相似案件中提取相似要件，进而对待决案件加以裁判。但它始终无法回答个案差异对待决案件的消极影响的问题。美国威斯康星州诉卢米斯案中的算法批判便是典型例证。在该案中，智能量刑算法主要是由研发人员总结、拆解、整合全国罪犯量刑案件，并分析其中被告人的生活环境、经济条件、犯罪记录等要素与量刑结果之间的关联性，进而获得的归纳性因果程式。14被告人认为，COMPASS系统虽然对全国量刑数据加以采样总结，但缺乏威斯康星州数据的完整比对，因此也难以保证裁判结果的准确性、周延性。上述周延性质疑在反驳传统归纳推理方法上，已经取得了一定的成效，并迫使我国法官不敢轻易在司法领域尝试。

在追求个案公正的司法领域，归纳性因果关系的建立必然遭遇“周延性”的追问。考虑到司法裁判对“因”“果”联系的必然性要求，归纳性因果关系必须是一个全称判断，即不存在任何反例。由此引发出“休谟之问”：能否根据有限经验而获得一项全称判断？15对于传统司法而言，受到法官有限认知与裁判经验的影响，基于归纳推理而获取的裁判结果往往难以获得公众认可。即便是当前的案例指导制度，也由于归纳推理方法的运用，只能采取“参照适用”的迂回战略来赋予指导性案例强制执行力。然而，在深度学习算法以及海量案例数据的支撑下，传统归纳推理的不严谨性概率会急剧下降。由于智能量刑算法的整个训练过程是超大量案例数据的累加训练、反复修正以及选择性进化的结果，因此，智能量刑算法的功能既是描述性的，同时也具备了判断性特征。前者是对既有司法判决结果的统计学表达，后者则是对待决案件的法治趋势判断。但是，急剧下降不等于彻底解决。尤其是面对个案公正的司法压力，经验归纳的周延性难题就给予了被告人反驳或上诉的充分理由。这一理由是基于归纳方法本身的弊端，并且无需提供额外证据。因此，在智能量刑算法的司法适用上，经验归纳的周延性难题必须加以解决。

（三）算法裁判的“系统性偏差”难题

在传统刑事司法裁判中，个案裁判误差或错误并不是很严重的问题。前者只具备个案效力，因此只要误差被控制在被告人可承受范围内，并不会产生严重的司法危机；后者过于明显，只会逼迫被告人通过上诉的方式予以纠正，因此其司法后果也不严重。但在智能量刑算法的司法适用过程中，个案裁判的误差与错误现象将发生质变：（1）个案误差有可能转化为智能量刑算法的指标误差、测量误差。这是因为，智能量刑算法是研发人员将简单案件指标化建模的结果。作为一种量化技术，智能量刑算法“简约化和通用性的内在要求与社会环境复杂多样的现实状况之间的矛盾导致了瞄准偏差的出现”，16如地区性偏差、人文性偏差、数量性偏差等。为此，这类误差是以类案形式发挥普遍影响的，而不只是影响个案。（2）个案错判则将改写司法审级制度。即便智能量刑算法是专门针对简单案件而研发设计的，但法官与智能量刑算法均没有精确区分简单案件与疑难案件的客观标准。当某一疑难案件被置于智能量刑算法之中时，无论它属于疑难案件还是简单案件，均能够获得一项裁判结果。由此，智能量刑算法所遭遇的个案错判难题，势必需要对“上诉”的前置程序以及后续程序作出较大的调整。在此，智能量刑算法引发的误差与错误，可以归结为一种“系统性偏差”，即因算法的潜在偏差所引发的一系列类案裁判误差或错误。

“算法优化”“审级制度完善”可以改善智能量刑算法的“系统性偏差”难题，但这种改善方案只能应对算法裁判初次正义分配。当中国裁判文书数据库兼有法官判例和算法判例时，智能量刑算法的“系统性偏差”难题就面临“正义标准二元化”的拷问。具体来说，在法官判例和算法判例的双重作用下，智能量刑算法要么坚持智能量刑系统一贯的裁判标准作出裁判，要么按照法官修正后的裁判结果作出裁判。无论是采取哪种裁判标准，都只能具有相对意义上的合理性。例如，坚持算法裁判的既有标准而不作优化，是假定“正义标准二元化”现象仅为智能量刑算法的特例。在社会未发生明显变化的情况下，简单案件的犯罪行为、刑事责任也不会发生明显变化。因此，自始至终信任算法裁判，而不考虑法官改判的结果，符合简单案件裁判的统计学原理。但坚持适用法官改判结果能够在进化论意义上获得较强的合理性支撑。当智能量刑算法存在“系统性偏差”时，适用法官改判后的判例，能够防范智能量刑算法的错判风险，进而主动规避系统性的误差或误判。但问题在于，法官改判是对智能量刑算法“量化规范逻辑”和“经验规范逻辑”的否定，而且改判后的反例也将引发智能量刑算法“归纳推理方式”的司法适用危机。因此，智能量刑算法的“系统性偏差”难题，必须在制度层面上作好防范措施，以应对繁琐的个案质疑。

三、智能量刑算法司法适用的程序法回应

智能量刑算法的司法适用，是目前世界各国司法体制改革的必然趋势。虽然智能量刑算法是当下智慧司法改革借助高新科技，解决“案多人少”的技术性手段，但这一技术性改革反映在诉讼进程中，则展现为诉讼程序的全新变革。不同于区块链技术、视频摄像技术、电子证据等技术手段在诉讼程序中的应用，人工智能辅助量刑将改写我国刑事诉讼法的许多关键程序。主要理由在于：前者的司法适用，均表现为法官个体思维主导下的证据审查革新。其本质是以技术手段增强案件事实的真实性、可还原性，与法律条款的规定无关。而智能量刑算法则不同。它是在法官之外重新确立了一个“案件决策思维”。尽管现行法律体系尚未肯定其案件决策主体地位，但对于司法裁判（乃至法律体系）而言，智能量刑算法在法律领域嵌入了一种全新的“决策思维”。既然是嵌入式的融入，那么法律有必要对此加以规制，以防备智能量刑算法的各种决策风险。由于人类无法同智能量刑算法讲道理，甚至无法观测其思维决策过程，因此，受到智能量刑算法技术性特征的影响，我国无法在实体法上对其施加约束，而只能以诉讼程序方式加以明确，以此来降低错案的发生率。有鉴于此，程序法回应就成为规范智能量刑算法司法适用的唯一改良路径。

（一）建立算法裁判的司法听证程序

智能量刑算法是我国当前积极推动“量刑规范化”“同案同判”的重要成果，代表着“智慧司法改革”的最前沿成就。但这并不意味着智能量刑算法就是一种天然的免检产品———它既不是民主决策的产物，也不具备法治先验性———一个新生科技事物要在司法领域获得认可，关键是看它能否承受专业性和公共性的考验。为此，司法听证程序就成为智能量刑算法及其他科技产品进入司法领域的必要关卡。并且，在通过司法听证程序之后，除非证明智能量刑算法存在明显的“系统性偏差”，否则无需在每一起案件中证明智能量刑算法的科学性。在司法听证程序的设计上，考虑到司法活动的专业性、裁判对象的公共性，司法听证程序可以参照“立法听证”的基本模式，在现行司法体制基础上加以嵌入式构建。但是，司法听证程序必须表现出更为严格的制度建设思路。这是因为，立法听证的目标是让法律规定更加民主化、科学化。但距离真正的法律制裁，还隔着行政执法和司法裁判。换句话说，即便立法听证存在不民主、不科学之处，其结果未必直接影响社会公众。但司法听证则不同，它既需要考虑听证结果与法律制裁之间的直接关系，还需要解决算法与社会公众之间的信任问题。鉴于智能量刑算法与司法裁判的专业性、听证结果的社会性之间的紧密关系，司法听证程序的具体构建如下：

(1）提请召开听证会。“智能量刑算法”等科技成果的司法适用是一项惠及全国的司法改革，必须在国家层面上达成统一共识。因此，有权提请召开听证会的主体必须限定在最高人民法院一级，而不能由各个省市单独改革。由于算法裁判在不同诉讼领域的成熟度不同，司法听证会提请主体的范围也应当考虑到科技的共通性与独特性。因此，“智能量刑算法”等科技成果的司法听证会提请主体应当限定为最高人民法院审判委员会以及各专业委员会。尤其在“智能量刑算法”司法适用问题上，最高人民法院刑事审判专业委员会较之于民事审判专业委员会、行政审判专业委员会以及执行专业委员会而言，更具备专业判断和适用需求，也更能够胜任“提请主体”一职。有鉴于此，除非某项科技成果能够通用于整个司法领域，否则召开司法听证会的提请程序，应优先由最高人民法院各专业委员会提起。

(2）听证质证。听证质证是司法听证程序的关键事项，主要功能在于模拟智能量刑算法运作实况，分析其中风险并提出对策。为此，听证质证主体的选择，应当按照组别（或委员会）方式划分为专业组、社会组和监督组。根据智能量刑算法的涵盖领域来看，专业组应当具备法律知识、裁判经验和科技判断三种能力。相应的，专业组的构成就必须包括法学家、法官以及算法工程师。其中，法学家、法官分别从理论与实务两个角度来审查智能量刑算法的观测指标、量化范围、阻却事项以及法律适用等法律要素，并对算法裁判结果与法官裁判结果加以比对，提出智能量刑算法的精确度判断。而科技专家主要负责裁判要素的程式化表达，防范算法运作漏洞，确保算法安全。社会组的设置，则是考虑到算法裁判的社会性后果。无论是社会公众还是罪犯，都将受到智能量刑算法的影响。前者因算法裁判而疑虑，后者因算法裁判而受惩罚。故此，社会组的构成应当囊括社会公众代表和（服刑中的和刑满释放的）罪犯。两者以公共道德和公共认知的视角判断智能量刑算法的潜在社会风险和伦理风险，并对此提出改进建议。监督组特指全国人大常委会对最高人民法院“算法裁判”改革的监督，意在保护公民的基本权益，防备司法机关借听证会之名“拟制”公共意见。17

(3）听证表决。由于司法听证程序缺乏立法机关“立法听证—立法审议”的二层次划分，因此在司法听证程序制度设计上必须直接设定听证表决程序，以完成司法听证活动。为此，司法听证表决必须首先明确表决主体。鉴于听证质证活动中的组别（或委员会）划分方式，司法听证表决主体应当涵盖各组别，听证结果也应当是各组别共同决策的集合。但考虑到司法听证结果的公正性，听证表决不能采用“多数决”的方式，而应当在专业组、社会组和监督组中分别设定表决权重。专业组负责“技术审查”，仅陈述算法裁判可行性，故权重较低。而监督组、社会组以“消除社会疑虑，维护法治统一”为听证目标，且听证表决直接关涉社会治理效果，故权重最大。智能量刑算法如果要在司法领域适用，必须获得三个组别的共同认可。倘若监督组和社会组表决结果不佳，那么智能量刑算法不得适用于司法裁判；假如专业组表决结果较好，也只能证明技术可行性，仍不能适用于司法裁判。

（二）建立算法裁判的衔接程序

审级制度是国家为了满足当事人公正需求而设置的一套诉讼程序。如果当事人认为初审判决不公正，那么国家就应当提供额外的诉讼保障机制（即二审和再审），以保证当事人的公正需求得到满足。无论二审法院认为一审判决是否正确，设置审级制度的程序性目的都已达到了。然而。智能量刑算法的司法适用，打破了我国现行审级制度与当事人公平需求之间的紧密关系，算法误判无法在审级制度上得到良好纠正。为了全面推进智能量刑算法的司法适用，我国应当围绕智能量刑算法的科技特性，在现行审级制度的基础上，嵌入下列两项司法程序，实现算法裁判与法官裁判的有效衔接。

其一，增加智能量刑算法选择程序。智能量刑算法是我国司法机关面对“同案不同判”“案多人少”等现实难题提出的技术性改良方案。可以说，它是司法机关主导的，以提升司法效率为价值导向的司法“投资”。公民法律权利保障既不是它的首要目标，也不是它的最终归宿。但是，刑事裁判后果却落在了社会普通公众身上。为此，即便司法听证程序能够保证智能量刑算法的科学性、公正性，社会公众仍应当享有算法裁判的选择权。18而且，选择的结果是不可逆的，否则司法程序的终局性意义便不存在了。这也意味着，选择权行使的时间及其程序至关重要，具体设置为：在案件审理结束后，由法官直接向被告人提问“是否接受算法裁判”。若被告人同意，则直接采用智能量刑算法获得裁判结果，且法官不得主动干预、审查裁判结果。在此，排除法官审查裁判结果是审级意义上的程序设计，既是为了实现智慧司法的高效性，也是为了保障“同案同判”和“量刑规范化”。

其二，建立算法判决申诉程序。审级之间的变化，旨在解决一审法院裁判不被接受（并不意味着不公正）的难题，并为不接受者——公诉人或者被告人———提供纠错机会。因此，算法裁判嵌入现行审级制度，必须解决好一审法院算法裁判的申诉问题。此时，一审法院将面临四重困境：申诉的承办主体、申诉的具体审级、申诉标准以及申诉效力。在申诉承办主体上，由于一审裁判主体是智能量刑算法，那么申诉承办主体就一定不能是智能量刑算法，否则按照智能量刑算法的量化逻辑以及经验逻辑，申诉结果只会与一审判决相一致。因此，申诉主体只能由法官担任。而且，由于一审法官全程参与案件的审理活动，对案件事实较为清楚，故此，该案件的一审法官可以作算法裁判结果的纠错者、复核人，且无需提升审级。为了防备被告人缠讼现象的发生，19对算法裁判案件的申诉标准应当作出更为严格的限定。例如，提供新证据、说明申诉依据或证明智能量刑算法的“系统性偏差”等。一审法官认为应当改判的，改判后的判决应当载明特殊标识，并查明此次改判的影响要素，在后续算法裁判中获得优先检索与适用，以规避智能量刑算法的系统性偏差。

（三）面向刑事变通的伴随性审查程序

东、中、西部社会经济文化差异，是我国当下社会治理体系必须面对的客观情况，也是智能量刑算法在追求“同案同判”时必须关注的问题。对此，刑法第90条规定：“民族自治地方不能全部适用本法规定的，可以由自治区或者省的人民代表大会根据当地民族的政治、经济、文化的特点和本法规定的基本原则，制定变通或者补充的规定，报请全国人民代表大会常务委员会批准施行。”该条款表现出刑事立法的两种适用性变化：一是民族差异等客观因素可以影响刑事案件的“同案同判”；二是政治、经济、文化等人文要素在一定程度上可以构成刑事司法裁判统一化的合法阻却事由。虽然自治区或者省级人民代表大会在实践中并未实际使用刑法变通权，20但司法机关在智能量刑算法适用上必须对此加以解决。这既是对我国“民族区域自治”这一基本国策的技术性细化，也是防备智能量刑算法“系统性偏差”的必然之举。为此，在智能量刑算法适用范围（如盗窃罪、强奸罪、诈骗罪等）内，司法机关应当面向刑事变通建立智能量刑算法的伴随性审查程序。

智能量刑算法的伴随性审查程序是在被告人选择算法裁判的基础上，受刑事变通事由的影响，而由法官对算法裁判结果加以伴随性审查的程序。考虑到智能量刑算法的全国通用性，伴随性审查程序并非是对算法选择程序的否定，而应当视为算法裁判对刑事变通事项的特殊对待。变通后的裁判结果既不违背“同案同判”的司法目标，也不得作为智能量刑算法的检索对象。但为了保证刑事司法的统一性，我国应当严格限定伴随性审查程序的适用范围，并将刑事变通事项限定为以下三类案件：一是少数群体价值观同刑法价值观相冲突的案件。刑法价值观是国家按照当下社会治理需要而设置的主流价值观念，但并非所有的区域、民族都奉行这一主流价值观念。二是风俗习惯同刑事要件相吻合的案件。当前，我国一部分地区或民族仍然保留了某些地方性风俗，甚至某些风俗习惯同现行刑法规定相冲突。三是经济水平与刑事处罚显失公平的案件。刑法历来强调“罪责刑相适应”。尤其是在智能量刑算法和中国裁判文书公开化的影响下，东、中、西部地区的“同案同判”已经具备技术上的操作性。然而，由于经济发展水平的客观差异，东、中、西部地区涉及货币量刑和财产性惩罚的同类案件，实际上带来的社会危害性并不相同，被告人由此所应承担的刑事处罚也应当有所区别。因此，为了推动量刑的实质性公正，司法机关必须在追求“同案同判”时，兼顾少数群体价值观、风俗习惯以及经济水平等方面的殊异性，并在尊重被告人算法选择权的基础上，开展主审法官的伴随性审查程序。

结语

从传统司法到“智慧司法”（尤其是算法裁判）的结构性转向，是我国解决“案多人少”“同案不同判”难题的必然选择。而之所以这一结构性转向肇始于刑事司法领域，主要是因为智能量刑算法所依托的要素化决策机制与刑法构成要件的内在逻辑不谋而合，并且未给予法官、检察官以及被告人？过多的协商空间，由此避免了结构性转向初期司法裁判的剧烈动荡。而民事诉讼与行政诉讼则不然。相较于刑事诉讼，民事诉讼更为关注当事人处理纠纷时的“合意”，因而“调解”“协商”以及“执行率低”等法律不可控因素都成为民事类智能裁判算法生成与发展的主要掣肘；行政诉讼则主要受制于行政程序杂乱以及行政行为定性等难题，无法在全国层面构建起智能裁判算法的“同案同判”。21因此，刑事诉讼就成为“智慧司法”转型初期的主阵地。在以“智能量刑算法”为典型的智慧司法改革面前，一些传统的法律概念（如“法官”“事实”“经验”甚至是“同案同判”）被赋予了新的含义，由此开启了司法裁判的“技治主义”时代。受到技治与法治的交互影响，上述传统概念变得可以被量化，“同案同判”也开始在司法大数据面前获得强有力地证实———在此之前，“同案同判”只能停留在司法裁判的形式性平等与理论证成———但智能量刑算法是一把“双刃剑”。“理性的法律人应该以‘大胆而谨慎’的眼光审视人工智能在人类伟大历史发展进程中的卓越地位，并对人工智能的发展予以法律上的积极应对和引导。”22作为一种司法手段，算法裁判会提升司法权运行的效率；而作为一种决策机制，它只能基于已设定的指令作出程序性判断，而无法掺杂情感、伦理、道德等价值判断。这也意味着，程序性制约已成为算法规制的唯一路径，毕竟人们无法与算法讲道理。而巧合的是，程序建设一直以来都是法律发展的方向之一。虽然程序建设无法正面解决智能量刑算法的实质合理性问题，但将程序正义作为规范算法裁判的社会治理工具，并合理利用大数据筛选技术，也能够保证算法裁判结果的公正性。当然，这并非是说传统刑事司法已经过时了，也不必担忧传统刑事司法被智能量刑算法完全取代。一如我们所了解的，目前的智能量刑算法只能快速解决一部分要素化了的简单案件（例如典型的盗窃、抢劫、强奸、诈骗等刑事案件），而无法解决那些具有复杂价值判断或事实判断的刑事案件。因此，智慧司法改革的目标，只是瞄准“裁判效率”，而无法推进“裁判质量”。这样，未来刑事司法的构造，应当是“人类法官解决复杂案件”“智能算法解决简单案件”两种裁判模式及其诉讼程序的展开与衔接。由此观之，智能量刑算法的司法适用，在短期看来只是诉讼程序上的“修补”，而从长期来看，它无异于新型司法模式的开端。

本文为文章摘录版，如需引用，参阅原文

来源：东方法学. 2021(03)

文献数据中心|DATA CENTER

数据库使用须知马克思主义法学数据库全球化数据库 “司法文明”数据库 LexisNexis数据库 Heinonline法学数据库

“北大法宝”法律信息数据库 Westlaw数据库

友情链接|LINK

中国民商法律网中国诉讼法律网中国刑事法律网武汉大学环境法研究所武汉大学国际法研究所中国知识产权研究网吉林大学法学院吉林法院网中国法学网

地址:中国吉林省长春市前进大街2699号吉林大学理论法学研究中心邮编:130012 电话：0431-85166329 Power by leeyc