论文精粹|INFORMATION
武腾:数据资源的合理利用与财产构造
管理员 发布时间:2023-07-24 23:01  点击:720

一、问题的提出

《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(2022年12月2日,以下简称“《意见》”)提出:“建立公共数据、企业数据、个人数据的分类分级确权授权制度”“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”。《意见》为数据产权运行机制的建立提供了明确指引,也向数据法学研究提出了新问题。产权主要是经济学上的范畴,数据产权制度的建立则主要依靠财产法律制度来实现。在加快建立数据基础制度的背景下,有必要探讨数据资源与数据产品的界分依据,辨析两者与既有数据类型之间的关系,研究如何针对两者分别构建财产法律制度。

学界围绕数据的财产构造已有深入讨论和丰富成果。第一,基于劳动取得财产、保护投资、避免市场失败等理由,很多学者认为有必要赋予企业对数据的绝对权。在这一基本立场之下,不同学者分别提出新型知识产权说、〔1〕1数据资产权说、〔2〕2新型独立权利说、〔3〕3公开传播权说、〔4〕4按份共有说、〔5〕5数据用益权说、〔6〕6新型工业产权说〔7〕7等观点。第二,无论是主张构建独立绝对权的学者,还是反对构建独立绝对权的学者,〔8〕8抑或是对权利定位持谨慎立场的学者,〔9〕9都认为应对数据相关主体的利益需求进行平衡,对数据财产权的效力进行合理限制。〔10〕10有学者借鉴霍菲尔德法律关系理论,从“权利束”或“关系进路”视角出发辨析相关主体之间的法律关系,探讨个人、企业等主体的权益内容。〔11〕11第三,构建有关数据的财产权,需注重与既有财产制度的衔接,尤其需重视与商业秘密等无形财产制度的分工与协调。〔12〕12

上述研究深化了有关数据财产构造的认识,具有重要理论价值。然而,学说之间的有效对话和互相借鉴还不充分,阻碍了广泛共识的形成和具体制度的构建。既有研究的主要不足是:一方面,民法路径下的研究倾向于在严格区分信息与数据的基础上,将数据财产构造问题“纯化”为有体物财产构造问题,对知识产权理论和制度的借鉴停留在利益平衡等原则层面,不仅较为抽象,也欠缺与知识产权体系的平滑衔接;另一方面,知识产权路径下的研究倾向于将个人信息保护和利用规则“搁置”一边,缺乏对已公开个人信息合理处理制度以及个人信息可携带权制度的深入挖掘和充分运用。在计算机和互联网技术的语境下,应该强调数据与信息存在一一对应关系,个人数据与个人信息难以分割。同时,鉴于大数据的核心问题就是个人数据利用问题,不应在脱离个人信息保护和利用规则的情况下研究大数据财产构造,而应该将个人信息保护和利用制度与知识产权制度进一步联系起来。有鉴于此,本文拟从个人信息保护法与知识产权法相结合的视角出发,对数据资源与数据产品的界分标准、数据资源财产构造的主要目标和具体方案进行探讨。首先,揭示司法实践中关于数据获取和利用的分歧,并初步分析其症结。然后,尝试将数据资源界定为一个跨越原始数据与衍生数据二元划分的范畴,指出衍生数据也可能构成数据资源。接下来,探讨《个人信息保护法》中关于已公开个人信息合理处理、个人信息可携带权的规定在数据资源财产构造中的基础地位。最后,建议引导数据资源控制者自愿按照“公平、合理、无歧视”的原则与不特定主体订立合同,控制者因维护数据资源合理利用秩序、提供数据传输服务等而享有收费权。

本文所研究的数据主要是平台经营者控制的个人数据集合,以及以这类数据集合为基础,经过加工产生的数据产品。如此划定研究范围,原因有二:一是学界争议较大的问题是,企业对公开的个人数据集合是否享有财产权。平台经营者基于多边平台的经营模式,不得不将平台内信息向尽可能多的主体公开,记录这些信息的数据容易为其他企业所获取,平台经营者对数据排他控制的诉求与其他企业对数据开放共享的诉求之间存在紧张关系。这类数据以个人数据为主要组成部分,所涉利益关系复杂,必须结合个人信息保护法与知识产权法研究其财产构造。二是目前司法实践中的数据权益纠纷大多与平台内公开个人数据的获取和利用有关。〔13〕13特别是围绕社交平台、电商平台内数据的获取与利用,经营者之间的对抗十分激烈,平台内公开数据的获取和利用秩序正是数据基础制度构建中亟需解决的问题。唯须指出,本文以应用价值和用途为标准区分数据资源与数据产品,并针对两者分别构造财产法律制度的结论,不仅适用于个人数据,也适用于非个人数据。

二、在数据财产构造中区分数据资源与数据产品的意义

(一)司法实践中关于企业数据获取和利用的分歧

司法实践中关于企业数据〔14〕14获取和利用的焦点问题之一是,平台经营者的“网络机器人排除协议”(robotsexclusionprotocol,以下简称“robots协议”)禁止他人获取平台内数据,他人违反robots协议获取和利用数据的,是否构成侵权行为。同案不同判的现象较为常见。〔15〕15

在“北京字节跳动科技有限公司诉北京微梦创科网络技术有限公司不正当竞争纠纷案”〔16〕16(以下简称“字节跳动诉新浪微博不正当竞争纠纷案”)中,微博平台经营者甲公司在robots协议中专门将乙公司的网络机器人宣布为不受欢迎者,乙公司称该“歧视”行为属于不正当竞争行为,要求甲公司停止该行为。一审法院认为甲公司单方限制乙公司抓取对其他企业公开的网络信息,违背公平竞争的要求,与网络行业互联互通的基本价值不符,损害网络市场的竞争秩序。二审法院则认为数据已经成为重要的生产要素,甲公司对数据的收集、整理耗费巨大人力、物力、财力,即使甲公司的行为客观上可能造成“歧视”,在不损害消费者利益和竞争秩序的前提下,也应认定其系正当行使经营自主权。两审法院的裁判结论截然相反。

在“深圳市腾讯计算机系统有限公司、杭州祺韵网络技术有限公司等著作权权属、侵权纠纷、商业贿赂不正当竞争纠纷案”〔17〕17(以下简称“腾讯诉祺韵侵权纠纷案”)中,人民法院认为,用户因注册、浏览、交互式参与等行为而产生的原始数据,只要经过平台内用户的授权,即使未经平台经营者的同意,其他企业也可以进行商业化利用;数据获取者的行为并非不正当竞争行为,如果禁止该行为则可能导致数据封闭和数据垄断。

上述两案的相同或相似之处包括:①所涉及的数据都属于平台内用户自行公开的个人数据;②数据获取者都在一定范围内取得了平台内用户的授权;〔18〕18③数据获取者都是在未取得平台经营者同意或者超出其授权范围的情况下获取数据;④数据获取者获取数据的目的都是为满足自身开展商业活动的需要。在上述两案件中,人民法院都试图在数据开放与数据控制者财产权益保护之间进行谨慎平衡,所得出的结论却有很大区别。

司法实践中另一突出问题是,人民法院经常以数据获取者违反诚信原则为由,认定其构成不正当竞争行为。比如,在“深圳市腾讯计算机系统有限公司等诉斯氏(杭州)新媒体科技有限公司不正当竞争纠纷案”〔19〕19(以下简称“腾讯诉斯氏不正当竞争纠纷案”)中,人民法院认为robots协议是互联网行业公认商业道德的具体体现,以数据获取者违反微信公众平台经营者发布的robots协议为主要理由,认定其违反诚实信用原则。

上述案件大多涉及网络机器人排除协议和违反该协议的法律效果。在计算机网络中,“协议(protocol)定义了在两个或多个通信实体之间交换的报文的格式和顺序,以及报文发送和/或接收一条报文或其他事件所采取的动作”。〔20〕20该协议与民法上的协议或者合同不可混淆,robots协议虽然传递出信息交换时通信实体的意愿,但是该意愿对不特定主体并没有法律拘束力。对于具体协议的法律意义须结合其功能具体分析。其一,平台经营者通过robots协议强化对数据的排他性控制的,未必是正当行使权利的表现。“字节跳动诉新浪微博不正当竞争纠纷案”中的二审裁判认为,通过robots协议禁止他人获取数据是企业行使经营自主权的表现。这一结论成立的前提条件是,平台经营者对被禁止获取的数据享有绝对权。只有对数据享有绝对权,平台经营者原则上才不需要理由便可禁止其他企业基于营利目的获取这些数据,即使这些企业愿意支付合理的费用。然而,上述前提条件在学界未获广泛认可。有学者指出,对于已公开的个人数据,企业只是有权依法利用,不能当然认定其归属于企业。〔21〕21有的主张,数据爬取可视作一项法律权益,“应运用权益权衡的方法,发现社会伤害最小的法律规则”。〔22〕22还有的指出,“数据爬取行为具有竞争中性的属性”。〔23〕23可见,平台经营者对平台内大数据是否享有绝对权、排他效力如何等问题仍然颇具争议,平台经营者通过robots协议禁止其他企业获取数据未必是正当行使权利的表现。其二,不同的robots协议内容不尽相同,有的协议内容并未遵循公平、合理、开放等互联网行业公认的原则。因此,不能笼统地将某robots协议内容认定为互联网行业商业道德的具体体现,更不能仅以数据获取者违反某具体robots协议为由认定其违反诚信原则。如果数据获取者获取数据的目的是满足合法经营的需要,而平台经营者禁止其获取数据的原因仅是为了消灭具有潜在威胁的竞争者,以便垄断平台内数据资源带来的所有商业机会,便不能认为数据获取者完全不顾及相关主体的利益。〔24〕24就此而言,“腾讯诉斯氏不正当竞争纠纷案”中有关数据获取者违反诚信原则的裁判理由失之片面。

在司法实践中,人民法院应当依法审查平台服务协议中约定的数据权利条款的效力,〔25〕25在综合考量各种因素之后,认定违反robots协议的企业是否实施侵权行为、如何承担赔偿责任。目前部分司法裁判之所以未能照顾到其他企业获取和利用数据的利益,主要原因是数据分类不够完善、数据利用规则不甚明确。人民法院经常在区分原始数据与衍生数据的基础上,认定平台经营者对其加工之后的衍生数据享有绝对权,其他企业尽管经过信息主体的同意,未经平台经营者的同意获取和利用该数据的,仍构成不正当竞争行为。然而,上述数据类型的区分不足以为数据权益的界定提供精准指引,有关个人信息可携带权和已公开个人信息合理处理的规则也尚未受到充分重视。有必要进一步完善数据分类的标准,发挥《个人信息保护法》中关于个人信息利用规定的作用,在此基础上探讨数据控制者财产权益的性质和内容。

(二)区分数据资源与数据产品有助于准确构造数据财产

对不同类型的数据加以区分,是有效讨论和科学构建数据财产制度的前提。目前广泛采用的数据分类方法有三。一是区分个人数据、公共数据与企业数据,二是区分原始数据与衍生数据,三是区分公开数据与非公开数据。第一组分类主要是以数据所涉及的利益为区分依据,个人数据、公共数据和企业数据分别以个人信息权益的保护、公共利益的实现和企业财产利益的满足为重心,彼此之间存在交叉,个人数据、公共数据的概念已为法律规范所采用。〔26〕26第二组分类是以数据是否经过加工或者增值为区分标准。第三组分类是以数据是否具有公开性为标准,以数据是否可以受到商业秘密制度的保护为着眼点。〔27〕27上述数据分类有重要意义,也有继续细化和完善的空间。

在司法实践中,区分原始数据和衍生数据是很多法院处理数据权益纠纷的关键步骤。〔28〕28原始数据与衍生数据的区分以是否进行加工、是否增加使用价值为标准。所谓加工,主要是指经过算法计算、聚合等产生系统的、可读取的数据,所谓增加使用价值是指产生可以进一步应用的价值。一般认为,企业对原始数据不享有绝对权,对衍生数据则享有绝对权。〔29〕29不过,各类衍生数据被加工的程度不同、应用价值也存在很大差异。仅仅依靠原始数据与衍生数据的区分,不足以为数据财产制度的构建提供精准指引。在此基础上,还需要借助数据资源与数据产品的区分,才能针对不同衍生数据构造妥当的财产规则。

数据资源这一范畴并非由《意见》首次提出,在《网络安全法》中便已对“公共数据资源”作出规定。〔30〕30有的立法专门调整特定领域数据资源的保护和利用。比如,我国人类遗传资源与我国数据资源相互重叠,利用人类遗传资源材料产生的数据是人类遗传资源的组成部分,受到《人类遗传资源管理条例》专门调整。〔31〕31该条例第1条规定,对我国人类遗传资源既要“有效保护”,又要“合理利用”。这不仅是人类遗传数据资源制度的立法目的,也是其他数据资源制度构造的根本遵循。数据资源的特点是:①数量多、类型多,具有巨大的潜在应用价值;②具有显著的公共性,属于广义上的公共数据;〔32〕32③无论是否公开,都要促使其得到合理利用。〔33〕33《数据安全法》《个人信息保护法》《人类遗传资源管理条例》等法律法规都为数据资源的合理利用提供了法律依据,〔34〕34并专门规定了限制数据资源向境外流动的规则。〔35〕35

数据经常被比喻为石油,以突出其为经济赋能时的重要地位。〔36〕36借助石油生产加工过程,有利于理解数据资源与数据产品的区分。在日常生产生活中,人们不能直接使用储藏在油田中的原油,只有将原油不断进行加工,才能产生石油燃料等用途不同的各类石油产品。〔37〕37能够称之为资源的,不是具体类型的石油产品,而是聚集起来的原油。石油资源属于自然资源,具有广泛用途,其利用和流通受到较强的国家干预;每一类石油产品的制造都是为满足特定用途之需,石油产品可以在市场中自由流通。数据资源亦然,无论是记录自然世界信息的数据,还是记录人类活动信息的数据,只要堪称为“资源”,就意味着在经济社会中具有广泛用途,但在进行深加工之前,其应用价值是抽象的、不特定的,而且是潜在的。需要指出的是,数据资源不仅包括汇聚之后的原始数据,还包括经过初步加工的衍生数据。

在衍生数据中,深加工之后的数据应用价值明确、用途特定,经营者往往只向支付了对价的特定主体提供这类数据,其通常属于数据产品;初步加工的衍生数据应用价值往往不明确、用途宽泛,经营者可能基于其商业模式或者法律规定不得不公开,其通常属于数据资源。下面结合案例或事例加以具体说明。第一,记录平台内用户公开言论的数据通常是经过加工的数据,如经过分类、排列,使其可视、易读,故不属于原始数据。但是,其中不可避免地存在不真实、不完整等情况,不经过深加工便无法精准分析平台内经营者的商品或服务的市场价值,故这类数据的应用价值是潜在的,用途也较为宽泛,其属于数据资源。在有的案件中,人民法院认为电子商务平台内的用户评价数据属于衍生数据,只不过未揭示其数据资源的属性。〔38〕38第二,平台内用户搜索量、阅读量、点击率、点赞数等数据是经过计算之后产生的衍生数据,其通常也属于数据资源。在实践中,有的企业试图将这类数据约定为自身绝对权的客体。比如,《“抖音”用户服务协议》(2022年7月7日生效)第6.3条规定,对抓取、统计、获得的相关搜索热词、命中率、分类、搜索量、点击率、阅读量等相关数据,在经公司事先书面同意前,不得以任何方式公示、提供、泄露给任何第三人。〔39〕39然而,搜索热词、搜索量、点击率、阅读量等数据是大量个人数据被计算之后得到的衍生数据,其记录的事实信息对于评价广告或者宣传的真实效果,对于消费者了解相关商品或服务,以及热点事件的真实状况具有重要意义,故属于应当加以合理利用的数据资源,不应由平台经营者享有绝对权。第三,能够准确反映特定用户群体消费习惯的数据,如用户画像数据,在提供精准媒介服务等场景中有确定的、显著的应用价值,有助于增加平台经营者撮合平台内交易成立的概率,属于深加工之后的数据产品。通常情况下,只有订立合同并支付对价或者有特别商业联系(如属于同一企业集团)的经营者才能获取和利用该数据。比如,在“安徽美景信息科技有限公司与淘宝(中国)软件有限公司商业贿赂不正当竞争纠纷案”中,所谓的“生意参谋”数据便属于数据产品。〔40〕40

数据资源与数据产品的区分对于准确把握数据财产构造和数据交易形态具有重要意义。第一,实现数据资源的合理利用,不以数据资源之上存在绝对权为前提条件。在实践中,大量原始数据传输活动发生在技术服务、企业收购等交易中。在2014年脸书(原名为Facebook,现更名为Meta)收购WhatsApp的交易中,欧盟委员会之所以未质疑该项交易活动的合法性,原因之一是,“脸书既不出售其收集的用户数据,也不把数据分析服务作为一种有别于广告空间的独立产品向广告主或者其他第三方提供”。〔41〕41在数字企业与其他企业之间,一般不会以数据资源(尤其是原始数据的集合)为标的物订立买卖合同、许可使用合同等提供财产的合同,而是订立有关数据传输、加工等服务的合同,数据传输通常不会也不必伴有财产权的设立、转移、消灭等。提供服务的合同能够帮助各类数据资源得到开发利用。

第二,与数据资源不同,对于经过深加工、具有明确用途的数据产品,须充分尊重企业的经营自主权,原则上应当通过知识产权制度加以保护。在实践中,有的数据产品便被认定为作品。在“北京四维图新科技股份有限公司诉北京奇虎科技有限公司等著作权权属、侵权纠纷案”〔42〕42中,焦点问题之一是,地图数据产品是否构成著作权的客体。人民法院指出,现实世界的地理信息非常丰富,地图上能容纳的信息本身有限,筛选确定的信息必然要经过复杂的筛选过程,结果会因人而异,故导航电子地图有很大的创作空间,独立测绘的导航电子地图偶合或者与现有作品重合的可能性小。人民法院认为,该案所涉地图数据产品符合作品的要件。在实践中,经过深加工的数据产品还可能受到其他知识产权制度的保护。由于数据产品具有商业价值,且通常不能被公众轻易获取,所以只要采取合理保密措施,就容易受到商业秘密制度的保护。

数据产品交易的提法容易令人以为当事人是在买卖“数据商品”。其实,数据产品交易通常是用益之债与劳务之债的混合,用益之债是指知识产权许可使用合同,劳务之债是指以大数据技术为基础的服务合同。在数据产品交易中,为满足特定目的而提供服务是给付义务的主要内容。比如,平台经营者向平台内经营者许可使用商业秘密,并提供持续性技术服务,旨在实现增加平台内经营者的交易机会这一合同目的。有学者将与数据相关的交易描述为“销售预测力”(sellthepredictivepower)。〔43〕43预测力的取得不是财产转移的结果,而是必须依靠以大数据相关技术为基础的服务。只有依靠企业不断收集的数据和不断改进的算法,才能帮助用户精准预测未来事件。因此,在数据产品交易中,往往包含以提供技术预测为给付内容的服务合同。

来源:《清华法学》(本文为文章摘录版,如需引用,参阅原文)

文献数据中心|DATA CENTER

© 2009-2024 吉林大学理论法学研究中心版权所有 请勿侵权 吉ICP备06002985号-2

地址:中国吉林省长春市前进大街2699号吉林大学理论法学研究中心 邮编:130012 电话:0431-85166329 Power by leeyc