论文精粹|INFORMATION
康宁:数据确权的技术路径、模式选择与规范建构
管理员 发布时间:2024-05-02 08:08  点击:349

一、引言:数据确权的技术路径

随着数据作为生产要素的价值得到普遍认可,数据确权的问题引起学界越来越多的关注。实践中,由于数据技术手段与数据相伴相生,参考数据技术认定数据权利的做法较为常见。借助网络日志、区块链等技术确认权利状态,甚至打造数据流转与交易的可信技术空间,已经成为数据确权的重要探索。1然而,既有研究容易将技术应用视作一种默认的事实,而往往忽略技术应用所蕴含的内在逻辑,及其给确权理论带来的革命性影响。

传统财产理论和制度鲜有涉及技术维度的讨论,对数据确权存在解释力不足的问题。产业界最初以古典政治经济学的“流汗理论”界定数据所有权,这一路径激励了劳动要素大量进入数据市场,却客观上为数据垄断提供了合理性。2有鉴于此,世界主要国家采取的做法是,从特定数据的采集和利用入手,对数据用益权、相邻权等做出规定,并普遍搁置数据财产权的一般性理论阐释。3我国数据安全、个人信息保护相关立法,重点明确了个人信息数据、国家安全数据等重要数据的处理边界,但也未明确界定数据财产权。4受此影响,两个方面的问题已经凸显:一是作为基础范畴的数据财产权缺少具体制度的支持,数据流动的便利性和规范性受到限制;5二是数据本身与传统财产客体存在较大差异,以数据加工和利用为基础的数据财产权涉及复杂的权利分配关系,数据持有、使用、交易、处分的特定权利虽然理论上可以分别成立,实则容易产生争议。6为此,2022年12月中共中央、国务院颁布的《关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)提出数据流通各环节的产权制度,数据确权不再追问某个特定的所有权主体,而是在同一宗数据之上区分不同环节、不同主体的具体数据权利,确权政策开始直面流通数据的真实状态及属性。这一重要制度实践走到了理论研究的前面,同时也要求数据确权的学理建设朝着更加适应数据特征、符合数据确权基本规律的方向努力。

技术应用的确权意义,最早在通信工程领域获得认可,相关研究成果以提高技术的可信度为前提,探索数据文件、网络日志、区块链存证等算法的改进。7技术的可行性,推动西方产业界学者从数字版权、无人驾驶技术等实务数据的权利分配出发,认为技术视角下的立法更新是数据确权更加迫切的任务。8我国经济学者关注数据的生命周期和生产环节,在数据主体、内容、用途与市场等场景化的视角下展开研究,为数据流通中的权利界分提供了经济效益的论证。9法学界论者尤其关注到不同应用场景之下的数据主体多样性,主张数据确权实际是不同主体各负权利和义务的复杂关系网。10在此基础上,有学者主张借助技术手段稳定权利形态,以技术生成的权利凭证作为有效权属依据。11此类研究开始触及数据确权的技术手段,但尚未深入挖掘技术给确权逻辑带来的深刻变革。因此,数据技术如何支持数据权利的确认,特别是技术给确权理论带来什么样的范式转换,需要进行专门的探讨。

本文将梳理确权技术路径的产生与演进,然后根据技术应用对数据确权的支持方式,把数据确权区分为整体确权和进程确权两种模式。结合两种确权模式的结构功能和实际局限,本文认为两种确权模式并非简单的并列关系,而是呈现整体确权向进程确权嬗变的趋势。在此基础上,本文就确权模式的规范化给出相关建议,以期对当前数据确权的政策演进和实践发展有所助益。

二、技术路径的产生动因与主要模式

数据包含复杂多样的内容与组织形式,但技术却是数据状态的实际承载者。事实表明,即便缺少制度的直接引导,数据处分也能通过特定技术的执行来实现。这种技术应用对数据形态的承载或解释能力,就是数据确权模式产生的直接动因,而技术发展则为确权模式的更新变化提供了现实基础。

(一)产生动因:无体数据的权利探索

数据形态的界定存在难度。根据国际标准化组织(ISO)的定义,数据(data)是信息(information)的特定形式转化,以达到适合电子化交流、解释或处理的目的。12这里的信息,通常对应物理世界的事实、事件、过程或者思想等,但形式上只是技术运作过程创建的二进制字节或莫尔斯点。这些代码构成的数据,可以通过电子方式存储、复制和传输,不会因使用而耗尽,也没有明显的边界,甚至不能以可感知、可触及的形式存在。正因如此,数据的观感往往是凌乱、碎片化的,电子信息是数据,计算机记录是数据,传感器测量结论是数据,图像音频也是数据。形式的多变性使数据缺乏可以界定的媒介,导致数据权利的范围难以直接加以明确。

由于时效与整合程度的不同,数据归属的判断更加困难。随着介入主体和操作行为的变化,数据的体量、质量会出现新的堆叠与排列,形态的流转和变化性较强。13不同数据可以很容易地组合起来,且随着数据组合的增多,不同数据组合之间也相互结合产生更有价值的数据,新旧数据几乎叠加存在。与此同时,数据使用者的目的、知识和掌握数据内容的差异,会导致数据控制能力的差别。由于数据形态的不稳定,数据权利也具有即时性和变动性。为了掌握和控制数据,人们将数据存储于特定的有体介质中,比如计算机或者数据传感器等等。但存储介质不足以记录数据流动和处理的进程,且可能由权利主体之外的他者所掌握。

有鉴于此,立法与司法实践开展了“数据权利”的技术探索。这种探索来自一个基本的认知,即数据是技术操作的产物,数据的来源和归属能够通过技术观察与测量予以描述,作为测量方法的数据机器和算法能够解释特定场景下的数据状态,技术处理的痕迹也成为追溯数据操作行为的重要依据。即便是最为初级、简易的数据,也经历了从物理世界转化为数据的过程,需要以一定的技术处理手段为基础。自然界的事件、人物和行为能够转化为可呈现、可陈述的数据元素,由计算机语言处理、记载和储存。联合国国际贸易法委员会(United Nations Commission on International Trade Law)从技术路径上定义“电子数据”,规定“电子数据”系指以电子技术手段生成、传递、接收或存储的信息,电子数据包括“如何对数据进行分类,以及如何通过自动化手段管理记录这些信息”等重要内容。14沿着这一思路,欧盟委员会联合研究中心(the Joint Research Centre of the European Commission, JRC)2017年发布了《关于所有权、准入和贸易的数据经济学报告》。该报告主要在数据产权方面补充《通用数据保护条例》(General Data Protection Regulation, GDPR)的不足,认为“GDPR没有给予数据主体完全的所有权,……在很大一个领域,数据的所有权或剩余权利没有得到法律规定,或者规定不完全”,数据产权成为“de facto right”,即法律尚未明确规定却在事实上已经存在的权利。15

面对电子数据的基本特征,司法实务回归“谁拥有数据”的基础财产法问题,同时在数据的创造、控制和处理技术应用中做出“技术性的拟制”。早在1985年,美国印第安纳州法院已经承认数字资产是计算机技术产生的信息,并且“构成盗窃财务的目标财产。”162003年,美国联邦第九巡回法院在克莱蒙诉科恩案(Kremen v.Cohen)中,赋予网络域名数据作为财产的法律属性并认为,登记系统中的技术手段“使域名术语相关的权利类似于‘一块土地’能够提出的权利主张。”17不仅如此,联邦第九巡回法院以技术使用的材料为证据,进一步判定应当赔偿的数据价值。在我国,技术性手段在实践中的应用,已经为数字产品权属纠纷的解决提供了重要线索。目前,数字技术支持数字资产登记、授权、交易、使用和维权的服务体系,尤其应用到数据存证、版权授予、数字产品防伪追溯等领域,可以规范音乐、视频、图片、文字作品等数字产品市场。

(二)两种模式:整体确权与进程确权

根据技术应用的不同路径,实践中的数据确权可分为“整体确权”和“进程确权”两种模式。前者是通过数据集中论证完成概括性的权利确认。后者是在数据运作的进程中,以技术手段对进程痕迹进行跟踪、标记或者追溯,从而实现阶段性、局部性的确权。

确权模式中的“整体确权”,是对数据的产生、形态和内容进行概括性的技术认定。目前,整体性确权主要用于数据产品的权属确认,我国大数据交易所“提交权属证明+技术评审+认定”的确权模式,具有整体确权的实际效果。18在这种确权模式下,数据拥有者提交权属证明,交易所组织专家进行评审并公布结果。可以看到,除了借助网络日志、操作痕迹等进行权利验证,整体性确权与传统物权的认定与登记并无较大差异。整体确权试图确认数据的“所有权”,即经过特定的验证流程获得“谁拥有数据”的凭证,再为进一步的数据使用奠定基础。这是一种激励性极强的确权方式,尤其在互联网发展的早期阶段,整体确权解决了计算机软件研发产品的权利保护问题,起到了积极的作用。

整体确权在互联网技术发展的初期就已经产生。在web1.0时代,互联网以门户网站为主体,普通用户和互联网的交互仅限于在个人电脑的浏览器输入网站链接,互联网的功能以网站信息的发布和阅读为主,网站信息对用户而言是“只读”的,并不存在大量用户数据的产出、收集和利用问题。因此,这一时期的“数据”,主要意指互联网公司发布的门户信息,此类网站信息的基础则是主体明确的技术创新和研发投入。网站数据与产品设计存在深度的耦合,“数据”基本等同于原创性产品的权利辐射范围。互联网公司对网站信息发布、技术发明、外观设计等拥有整体意义上的权利,数据权属也不具有特殊性,可以转化为软件著作权、专利权、商业秘密等专门的权利进行保护。

进程确权模式将权利的确认置于高速率、大体量的数据生命周期,确权目标并不限于权利内容的概括性认定,还需兼顾数据价值的释放。进程确权模式产生于海量数据流动的web2.0时代,用于确权的技术伴随关键性技术革新手段的兴起。这一时期,用户产生大量数据内容并上传到平台,换取相应的服务和利益。随着数据收集、传播、使用的范围及速度迅速提升,互联网不再局限于单纯的信息发布与阅读,而是以多主体参与的信息交互为主。技术平台成为数据产生以后的实际控制者,平台及其后续数据处理者成为与原初用户并存的多元主体,数据的占有、处理和加工能够产生新的收益,却也造成了权益分配的高难度。整体确权模式下的权利完整性无法实现,普通用户和技术平台都局限于附条件的数据使用权。这一时期,区块链、智能合约、可信时间戳等技术的应用,极大提高了存证溯源、数据控制、计算处理的效率,能够对数据处理进程中的权利关系予以确认和存储,容纳并证明参与数据处理的实际内容。数据权属的界定,从数据物权的技术证立,向数据关系变更、数据利益界定的动态进程转变。

三、整体确权模式:数据“物权”的证立与局限

整体确权模式是传统“一物一权”财产理论在数据确权领域的延伸。传统财产理论倾向于明确且易于实施的所有权制度,并认为这是组织经济的最有效方式,财产法中的物权、所有权概念正是立基于此。19为数据创设尽可能完整的“物权”,是确保数据主体将足够的资源投入财富创造的有效方式,可以减少不确定性和讨价还价的余地。因此,界定数据的权属,容易转化为界定“数据属于谁”的问题,也就是“物权”归属问题。

(一)数据“物权”的技术证立

整体确权的逻辑假设,是数据生产需要投入一定成本,因此需要稳定的所有权激励机制。既然数据来自特定主体的加工投入,那么数据归属于这一特定的主体也具有合理性。如果数据的创造能够使人获利,那么人们会对奖励和报酬做出全力以赴的回应。这一基础的逻辑,决定了整体确权的对象是以思想性和原创性为支撑的概括数据产品。作为确权对象的数据具有法律意义上的完整性,无法做出要素、结构或者进程上的分割。确权只需凭借与数据相关的主体、行为和内容等证据资料,完成数据劳动关联性的技术建构。

整体确权的关键在于数据“物权”的证立。研发主体的劳动与数据之间存在直接的因果关联,这种因果关联的基础在于原创性的投入。为此,主张数据权利的主体应当提供数据产生与创立的证明资料,通常包括使数据从无到有的设计程序、标识数据内容的源代码以及记载完整操作信息的技术日志。这些“利用条件、环境、事件、交易、属性或过程描述为事实的任何数据……描述了信息系统中发生的事件或交易。”20证明资料至少明确几个基本的要素,一是数据的内容相对集中,数据所包含的实质性信息通常能够组成特定的数据产品;二是实施数据加工的主体具有单一性,除了分工明确的合作研发场景之外,数据权利归属于投入劳动的最主要贡献者,较少关注多类主体介入数据处理的情形;三是数据支配的行为由数据主体产生,控制、约束、改变和交易数据的举动与这一主体直接相关,可以留作操作行为的记录。

整体确权使数据具有了物权的对世性,数据主体追求实现排他性占有、使用、收益、处分数据的物权权能。尽管事实上占有数据仍旧存在难度,但权利主体对数据存储载体或者介质的占有,至少在形式上实现了数据的占有。借力于制度设计的保护,未经授权的数据剽窃与“盗窃财产”十分相似,它将影响进一步投入研发的积极性。由于延续了传统物权的基本逻辑,整体确权与传统物权的确权方式并无本质差异,尤其可以通过申请、验证、登记、备案等具体形式,完成权利形态的稳定化。在这种概括性的确权路径中,谁是权利的申请者,谁就是数据的所有者,也就是整体确权的保护对象。由此可见,整体确权的模式旨在实现数据创造者“拥有数据”,这种权利的属性是物权,以及与物权相关的一切实质性权能。

(二)整体确权的局限

整体确权更加关注数据产生的最主要贡献者,容易忽略不同数据主体和数据类型的价值阐释。整体确权有利于认定以技术研发为依托的终端数据产品,数据的权利是一个要么全有,要么全无的命题。一旦进入大体量数据分析与挖掘的场景,整体确权很难区分“同一数据、多个主体”的整体性权利,对高频度的数据变迁、流转和交易也无从入手。21实际上,介入数据的主体增加,直接导致权属关系的错综复杂。数据在用户的设备中被交出和处置,又在各类数据处理者的程序系统中存储并加工。不同主体之间不仅保有前后承继的时间顺序,更是彼此依赖的权属关联——用户是原初数据的来源,却并不全面掌握数据,实际控制能力通过数据处理者才能实现,数据处理者也必须依赖用户产生数据,才能期待进一步的数据利益。进入流通领域的数据就更加复杂,数据加工的众多操作环节可能在同一数据之上彼此覆盖,究竟某一数据处理行为的发出主体是谁,更难做出明确的区分。再者,高速的移动网络链接与平板电脑、智能手机等几乎无处不在的计算机终端设备,为数据产品的便捷传播提供了途径,数字下载和流媒体服务既是极为便捷的数据处理渠道,也提供了成本低廉的“数据盗窃”途径。如果不改变确权的基础逻辑,越来越多的“无权主体”将在实际上享有数据权利,整体确权模式所期待的稳定数据权利状态,在大数据处理时代很难维系。

整体确权以“限制应用”来鼓励创新,实际与大数据非竞争性、低交易成本属性相背离。经济学的研究成果认为,大数据的价值在于使用和流转,且这种使用和流转不因竞争关系的存在而受到影响。被分享和复制的数据与原使用者不构成竞争关系,使用者增多并不影响数据本身的价值。任何数量的公司、个人或机器算法可以同时使用这些数据,而不会减少其他主体可用的数据量。相反,小规模、单个数据的财富价值创造力极为有限,只有一定规模的数据能够产生持续积累的价值。如同古典音乐的社会价值,实际上在于数百年来人们的传唱和使用,这种重复使用不仅没有消耗音乐作品,反而增强了作品的生命力。从这个意义上讲,如果按照传统物权的规范性来约束数据,实际上是人为制造“数据稀缺”难题,限制数据价值的释放。正因如此,大量享有整体确权成果的数据主体主动放弃成果专有权,目的就在于实现大数据时代的快速普及与行业话语权,将数据以开放或者半开放方式推向市场。可以说,实现数据要素价值最大化的关键,正是促进数据开放共享和重复使用,这与整体确权的排他性占有大相径庭。22

整体确权对传统人工操作具有较强依赖性,存在确权证明难保存、易篡改的困境。对整体确权模式而言,代表数据内容和边界的技术日志、程序代码成为产权证立的重要凭证。为此,整体确权依赖确权机构做出信用背书,以登记备案的方式概括数据产品的权利归属。这类登记的实现,离不开数据权利申请者向确权部门提交的文件,例如,申请者通常提交原初数据、权利请求书和相关说明。确权机构进行权利的审核,尤其强调原初数据与权利人技术投入的直接因果关系,即数据由权利人的“劳动”而产生。相关说明文件对数据的构成情况以及处理日志做进一步解释,以利于确权机构和后续主体理解并使用数据。然而,网络日志之类的痕迹数据很难得到即时保存,并且,数据信息的提取可能导致电子信息与原始存储介质的分离,电子数据的证明力会降低。权利明示需要将电子数据打印出来转化为书证,不仅容易破坏电子数据的内容,也提高了权利认定的成本;数据确权以专门机构的审核为基础,还存在权力寻租、篡改数据的风险。最根本的障碍在于,大数据时代的数据生成并非来自单一主体的“劳动”,且数据加工和利用的状态具有实时性,很多时候根本无须对即将迅速过时的数据予以概括性认定。因此,尽管我国当前省级以上的数据交易所达30余家,但受到整体确权逻辑的影响,数据确权更加倾向于明确权利的集中归属,对流通数据的价值释放无法起到积极的作用。多种问题的存在,表明整体确权的模式具有不充分性,亟待新型确权机制的补充。

来源:《清华法学》(本文为文章摘录版,如需引用,参阅原文)

文献数据中心|DATA CENTER

© 2009-2024 吉林大学理论法学研究中心版权所有 请勿侵权 吉ICP备06002985号-2

地址:中国吉林省长春市前进大街2699号吉林大学理论法学研究中心 邮编:130012 电话:0431-85166329 Power by leeyc