引 言
随着大数据、人工智能技术逐渐渗入司法证明领域,引起建立在大数据基础上、以算法为核心的证明方式变革。大数据在司法领域的证明作用,突出表现在以下几方面:(1)证明主体身份。基于海量数据的生物特征识别技术开始用于人身同一性认定,
相较于实务界大数据证明运用的蓬勃景象,学界的大数据证明研究尚不多,且主要集中于对其证据形式、真实性及关联性的分析讨论。
一、大数据证明的机理
有学者从狭义角度出发,认为大数据证明的关键在于计算模型的构建,即通过算法所产生的数据结果;
传统司法证明,无论是证据证明,抑或是推理、司法认知,都是基于人类主观经验的证明。(1)司法证明主要借助证据与证据、证据与事实之间的逻辑关联,将事实碎片拼接成完整事实图画。
大数据证明则是依靠智能化算法来完成证明活动,是一种超越了人类经验的新型证明模式。一方面,大数据证明解决了人类经验难以完成的证明困境。大数据时代出现了证明对象海量化的趋势,特别是在一些互联网涉众案件中,提取的电子数据动辄上亿条。对此,仅凭人类经验浏览完数据集都是不可能完成的任务,更遑论进行证据推理。这种情况下,算法提供了一种超越人类经验的智能化证明方法。算法可将证明难题模型化,提炼出类案中的普遍证明规律与特征,用数学模型来取代主观推理。我国司法实践中已研发出不少互联网金融案件算法证明模型,例如我国司法实践中已研发出不少互联网金融案件算法证明模型,其证明机理由此可窥见一斑:(1)集资诈骗型:若海量资金账户链路指向某一个账户,基本可以判断该账户为“吸款”账户,属于集资、诈骗型犯罪。(2)税票虚开型:若资金流向呈现“闭环”模型,即资金在多个账户之间流转后,又回到最初的账户,基本可以判断为(税票)“虚开”的事实。(3)传销类犯罪:资金分散转入账户,但集中转出;资金交易具有一定周期性;资金链呈现“金字塔”形。
另一方面,大数据证明突破了人类经验尚未涉足的认知新领域。超越人类经验的智能化算法亦可被用来探索司法证明的新领域。近年来,DNA领域的证明“空白”由此得以突破。在单一DNA来源的案件中,一直以“人类翻译”(human interpretation)为主导方法。
可见,大数据证明能够弥补传统经验式司法证明的短板,大大拓展了人类证明的领域边界,是一种超越人类经验的证明模式。相较于传统证明,大数据证明还具有数据空间证明、数据因果关系证明以及涵摄未来证明等内涵。
(一)从侧重于物理空间的证明到侧重于数据空间的证明
传统证明主要以物理空间为场景。这里的“物理空间”既包括肉眼可见、可以直观感知的现实场景,亦包括以新兴电子数据为代表的“虚拟空间”。本质上来说,“虚拟空间”亦属于广义上的物理空间,其体现为0和1二进制代码所组成的空间。在物理空间场景,证据表现为证据载体以及根据载体所反映出的信息,主要根据载体所反映的信息进行事实证明。
大数据证明则以数据空间为场景。这里的“数据空间”不同于传统证明中所“自然”生成的物理空间,而是源于大数据时代的“万物皆可数据化”特征,探求物理空间中一切事物所对应的数据形态。理论上说,八种法定证据种类,均可映射在数据空间,有着相对应的数据化形态。大数据证明亦是“物数据化”的过程,将原本物理空间证明转移至数据空间,寻求基于数据及算法的证明方法。仍以人身同一认定为例,大数据证明可采用人脸识别技术来完成证明。其原理是将物理空间具像的人脸转化为图像数据,计算人脸特征的相关数值,再通过数据比对等算法来进行智能化识别。
(二)从侧重逻辑推理的因果关系到侧重基于数理的因果关系
传统证明侧重基于逻辑的因果关系。因果关系是人类认识世界的根本方式。在司法证明中,因果关系的理解及运用尤为重要,往往表现为从果溯因式的逻辑推理。例如张三在案发后神情紧张(果),假设作案人在案发后神情紧张,那么张三则有可能是该案件的作案人(因)。传统司法证明中的因果关系通过人脑的逻辑推理来完成。人脑在接受证据信息后,探究证据背后的原因,建立起证据与事实之间的因果关系,以及证据与证据之间的因果关系。
大数据证明侧重基于数理的因果关系。很多学者有这样的误解,认为大数据擅长相关关系而非因果关系,大数据证明中知道“是什么”就足够了。但实际上并非如此。相关关系实际上是因果关系的派生。
(三)从面向过去的证明到涵摄未来的证明
传统证明主要面向过去事实。大数据时代之前,人类活动主要是描述性的,即真实、精确地反映既存对象,以真实性为衡量标准。
大数据证明可涵摄未来事项。预测是大数据最具价值的应用。大数据时代人类活动转向创构性,即根据人的需要和发展进行开创性活动,以使用的有效性为衡量标准。创构性活动主要建立在大数据预测基础上,通过对相关因素的把握和干预,来达到预想的结果。
此外,从广义上来说,即便是传统的司法证明也有面向未来的因素,但在大数据时代之前表现得尚不明显。传统司法证明对象包括影响量刑、羁押、取保候审、监视居住等程序性措施的要件,典型的如嫌疑人“人身危险性”“再犯可能性”的证明。我国认罪认罚从宽制度中,可能判处管制、宣告缓刑亦要进行社会调查评估,对被告人的家庭和社会关系、一贯表现、犯罪行为的后果和影响等进行调查评估。大数据无疑为“人身危险性”“再犯可能性”的评估和预测提供了绝佳的工具。在美国,司法机关已普遍采用算法评估嫌疑人的人身危险性、再犯可能性,并将之作为假释和量刑的依据。人身危险性评估模型一般将当事人的人身背景及其历史犯罪等数据作为评价要素,预测其未来的犯罪风险。例如公共安全评估系统(Public Safety Assessment, PSA)在搜集美国300个辖区的75万项案例数据基础上,根据嫌疑人年龄、未决指控、未出庭记录等九项指标来计算能否保释该犯罪嫌疑人。
二、大数据证明的可靠性风险
作为一种新型证明方式,证明结果可靠与否乃大数据证明首先要面对的问题。不同于传统基于人类主观经验的证明方式,大数据证明本质在于机器自主、智能化分析。而在这一证明机理中,起关键作用的要素即数据和算法。因而,大数据证明的可靠与否主要取决于基础数据的真实性与全面性,以及算法模型的准确性与公平性,相关法律程序的缺失亦会对其可靠性产生影响。
(一)数据维度
数据质量及其真实性是大数据证明可靠与否的基础。大部分研究都认为数据源本身要准确,有学者还提出“宏观真实性”及“微观真实性”的观点。
1.法律层面的数据错误
原始数据一般都面临混杂性问题,包括格式不统一、数据重复、残缺、错误等。对于共性的数据混杂问题,可以通过数据清洗、数据转换等技术来解决。然而,司法证明中的数据混杂远不止技术层面。法律评价与技术评价的差异导致了虚拟空间的“数据”往往不能对应至背后的法律行为,技术真实的数据不一定法律真实,并进而导致法律事实认定困难。例如“点击数”“转发数”“浏览次数”“注册用户数”等海量数据型证据,每一次计数都来源于软件的自动统计,但这些机器计量数据并不一定就对应着具有法律实质意义的行为。某些网站的高点击数可能是水军“刷单”,注册的账号可能是“僵尸用户”,此外还有一人点击多次、网络黑客攻击、机器故障等情形。例如“邱成林、胡望、林春传播淫秽物品牟利案”中,涉案网站点击量5595957次系通过“CNZZ数据专家”软件统计得出,然而法官认为统计数是整个网站的被点击数,不等同于淫秽电子信息的“实际被点击数”,应当扣除非淫秽电子信息的点击数和无效点击的数量、自点击数等。
2.数据样本不全面
相比于传统证明方式,大数据证明具有海量数据的特征,但很多场景下并未达到“全数据”量级,并影响证明结果的可靠性。例如在涉及“百度指数”“搜狐指数”等指数型证据案件中,指数仅来源于其自身网站搜索量计算,而单一网站数据并不能代表被证明对象的整体发展态势。一些个案中,即便设计了科学的算法模型,但由于未能获取全数据,计算结果仍然未能得到法官采信。例如在美国海关欺诈调查局诉唯特利公司(United States ex.rel Customs Fraud Investigations LLC v.Victaulic Co)案中,
(二)算法维度
算法的科学性及准确性是大数据证明可靠与否的核心因素。算法的可靠性既取决于算法模型本身的设计准确与否,也取决于其在司法场景运作过程中是否公平公正。
1.算法模型不准确
算法模型是大数据证明中最核心的部分。很多研究提到了“算法黑箱”问题,但没有深入分析算法不可靠的症结点。实际上,源代码及算法设计环节都有可能出错;即使算法本身通过了验证,具体适用场景的差异也会导致验证结果不可靠。2015年,澳大利亚昆士兰当局确认,混合DNA分析软件STRmix中发现了错误代码,并造成至少60个案件中犯罪分子认定错误。
源代码出错及算法自主性。算法模型中最核心的部分为源代码(Source Code)。源代码是指一系列使用字母数字字符编写的命令。源代码出错的情形实际上远远超过法律人的认知范畴,包括随机性错误、软件升级带来的错误及误差、软件退化带来的源代码功能失灵、委托者的利益影响等。
适用场景不一致。实务中非常容易忽略算法适用场景的差异。当算法模型的实际运用场景与其开发环境、实验参数并非完全一致时,就有可能导致分析结果不可靠。以混合DNA算法模型为例,假设其研发时场景为三个人的DNA混合物,但适用的真实案件中却有五个人DNA混合物,那么则会导致证明结果不可靠。
2.算法模型不公正
算法模型在运行过程中容易造成偏见,偏离司法公正的要求。学者们多受英美研究启发,关注算法的种族、性别等歧视问题。例如在经典的卢米斯(State v.Loomis)案中,人身危险性评估软件COMPAS就被认为含有性别及种族歧视因素。
替代性变量(Proxy Variables)的运用。算法偏见的一个重要原因是替代性变量的运用。算法模型中,看似中立的变量可能是某类偏见的代名词。在大数据司法证明场景中,替代性变量往往表现为与目标对象无关的,甚至是法律禁止的变量,或者是以群体性变量来替代个体变量。(1)无关的变量:例如LSI-R(the Level of Service Inventory-Revised)是美国较为流行的人身危险性评估工具,其再犯风险调查问卷是根据犯人生活背景细节来制定的。原本这些背景性细节在法律上是不允许作为证据的,但其却披上算法外衣出现在法庭中。COMPAS软件也存在同样问题,它将一些假设性变量作为证明依据。例如变量中包含“你在学校多久打一次架”,甚至让被告人选择是否同意“饥饿的人有权利去偷窃”“当人们惹怒我时,我会变得非常危险”等偏见性问题。
恶意循环机制(Pernicious Feedback Loops)的加剧。算法本身会有一种反馈循环机制(Feedback loops),一旦机器学习的运算结果得到验证反馈,则会强化其模型中的某些变量,进而产生更多的该类结果。然而,场景及变量的选择会决定该循环机制是良性还是恶性。某些时候,即便使用中立的数据集,不公正的运用场景也会创建“有害的反馈循环”系统,使得一些歧视性变量、替代性变量被强化学习,进而产生更多的不公正结果。
(三)法律程序维度
程序透明也是大数据证明可靠与否的重要因素,透明的机制有助于倒逼数据质量和算法准确性的提升、消减算法偏见。目前大部分研究都关注到技术层面的“算法黑箱”,但忽视了法律层面的“程序黑箱”,即人为造成的法律程序不透明,且程序黑箱更为隐蔽。在美国,很多涉及大数据证明的案件中,每当被告方申请算法开示时,原告方/公诉方(或技术提供方)都以商业秘密保护特免权(Trade Secret Privilege)而拒绝开示。大数据证明的算法开示与商业秘密特免权的博弈来源于人民诉查布斯(People v.Chubbs)这一里程碑式的案件。
然而,越来越多的观点开始质疑在刑事案件中保护商业秘密的必要性。有学者指出,传统的证据规则已经无法适应新技术的变化,“现在用于生成犯罪证据的专有算法的复杂程度是前所未有的,而现有的证据规则还没有完全具备处理这些问题的能力”。
在中国,证据法体系中没有商业秘密特免权的规定,但并不代表当事人就能获得大数据证明相应的知情权及算法开示的保障。一方面,在一些刑事案件中,办案机关尽管运用了大数据证明方法,但审判环节并不会出现相应的证据形式,多转化成证人证言、电子数据等证据形式。从源头上切断了当事人知情权的来源。另一方面,即便一些案件中当事人知晓大数据证明的运用,诉讼一方会直接以鉴定意见的形式打消了对方当事人甚至法官对算法的质疑。例如在许有发诉淘宝一案中,
来源:《法学家》(本文为文章摘录版,如需引用,参阅原文)