基于个人授权的竞争性数据爬取

作  者:

作者简介:
沈健州(1988- ),男,广西南宁人,法学博士,上海交通大学凯原法学院副教授,研究方向为民法学、个人信息与数据财产。

原文出处:
政法论丛

内容提要:

随着承载于个人信息之上的利益期待从消极保护向积极利用延伸,用户便产生了授权第三方直接从特定平台爬取其个人信息数据的需求,而第三方与该平台往往存在竞争关系。如何判断这类数据爬取的正当性,需要系统权衡数据财产权益、个人信息权益、数据流通需求等不同价值考量,是数据产权制度中具有枢纽地位的基础性理论问题。尽管可携带权能为这类数据爬取的正当性提供底层逻辑,但不可忽视数据携带与授权爬取之间的现实差异,其主要体现在数据超范围转移的风险负担和被爬取方对“自主转移数据”的合理利益两方面:前者需要考虑数据超范围转移风险的事前防免与事后救济对于数据转移效率的不同影响;后者需要考虑平台不予转移数据的规范可能性,以及数据爬取的潜在附带损害。权衡之下,应对这类数据爬取持宽容态度,以强化用户对个人信息数据的支配并促进其流通,这也将有助于数据市场的良性竞争和有序发展。


期刊代号:D412
分类名称:民商法学
复印期号:2026 年 02 期

字号:

  随着数据成为生产要素而为人类贡献特有价值,“探索建立数据产权制度”便成为民法学研究的历史性任务。[1]尽管我国学界对数据确权的基本立场已经凝聚较高共识,[2][3]但对于如何在数据确权的前提下妥善兼容数据自由流通的客观需要这一问题,仍然歧见纷呈。[4][5][6]时至今日,通过爬虫程序实施的数据爬取行为,已在不断的争议中成为数据自由流通的核心方式之一。[7]在“探索建立数据产权制度”的语境下,如何对待不同类型的数据爬取行为,事关对数据自由流通尺度的把握,也决定着数据财产的权利边界与权利限制规则。对于包含个人信息的数据,除数据所承载的财产性权益之外,数据爬取的正当性判断尚需充分考虑个人信息权益。当个人授权第三方直接爬取其发布于特定平台之上的个人信息数据,而爬取方与该平台又存在竞争关系,数据爬取可能对该平台造成竞争损害,此时如何判断这类基于个人授权的竞争性数据爬取之正当性,便成为司法实践中的疑难问题。这无疑也是数据产权制度构建所必须直面的理论挑战之一。

  一、个人授权对竞争性数据爬取正当性的强化

  数据爬取问题之所以饱受争议,原因在于其利弊集于一身。一方面,互联网的发展离不开信息数据的自由流动,而基于数据爬取技术建立的搜索引擎(如谷歌搜索等),能够极大提升信息检索和获取的效率,这对互联网的发展功不可没。[8]对此,中国互联网协会发布的《互联网搜索引擎服务自律公约》第8条指明,互联网站所有者设置机器人协议应遵循公平、开放和促进信息自由流动的原则,限制搜索引擎抓取应有行业公认合理的正当理由。从实际效果来看,数据的自由流动能够有助于信息社会进步和社会福利提升,[9]这无疑也使数据爬取得以在一定程度上具备公共利益色彩。但另一方面,由于数据爬取技术的运用并不完全符合平台运营者的利益期待,且可能带来一系列负面影响,被爬取的平台对于数据爬取并不总是持欢迎态度,实践争议丛生。[10]在数据保护与数据自由流通两种不同价值取向之间,数据爬取行为的正当性并非简单的“全有”或“全无”问题,而是需要根据所涉及的不同利益因素加以权衡。[11]

  在当下的数字社会,数据所承载的个人信息也成为受保护的权利客体。对此,我国《个人信息保护法》通过扩张个人信息的保护范围,并强化用户对个人信息的控制,进一步实现了对个人信息的保护与利用。[12]就承载个人信息的数据而言,数据的爬取同时也是对个人信息的收集,与个人信息权益密切相关。[13]于此情形,对数据爬取行为的正当性判断,还需要进一步考虑数据之上的个人信息权益。

  (一)竞争性数据爬取中的个人信息权益考量

  从既有的司法实践来看,对于数据爬取的正当性判断,裁判者往往将数据爬取行为置于爬取方与被爬取方的竞争关系之中,围绕数据爬取是否构成不正当竞争展开分析。①

  尽管现阶段对于数据爬取问题的竞争法考量大多只能借助《反不正当竞争法》第2条的一般条款展开,[14]但对数据爬取正当性判断的核心考量因素,如爬取方与被爬取方之间是否存在竞争关系,数据爬取行为是否妨碍了正当的竞争秩序,是否符合行业惯例和商业道德,是否对被爬取方构成实质性替代等,理论与司法实践已然凝聚相当共识。[15][16]在此基础上,若被爬取的数据中包含用户的个人信息,则被爬取方通常会主张数据爬取不利于用户个人信息保护,以此将用户纳入其阵营,对数据爬取行为“同仇敌忾”。②基于对用户个人信息的保护义务,被爬取方的这一主张具有一定正当性。[17]根据《个人信息保护法》第51条,个人信息处理者有义务采取相应措施,防止个人信息被未经授权访问。这一规定虽然只是明确了个人信息处理者的义务,但无形中也为处理者禁止他人任意访问个人信息数据的行为提供了规范基础。在此情况下,如果数据爬取行为构成不正当竞争,而其中的个人信息权益也同样指向否定数据爬取的正当性,则个人信息权益便成为被爬取方用于强化其反对数据爬取主张的额外“筹码”。

  从实际权衡效果来看,若竞争性数据爬取本身就足以构成不正当竞争,即便不考虑用户个人信息保护的问题,这类行为也同样应当被禁止。[18]此时,被爬取方借助个人信息保护的考量以强化己方反对数据爬取主张的做法,也仅是起到了“锦上添花”的效果。

  然而,当用户个人明确表达出与被爬取方相反的态度,并支持数据爬取,问题便会趋于复杂化。在《个人信息保护法》的框架下,告知同意规则通常被认为是判断个人信息处理行为合法与否的基本标准。[19]这意味着,在未获得个人明确同意的情况下,处理者通常并无处理个人信息的合法性基础;此时,个人信息更多体现出消极防御的一面,即任何人均有义务尊重和不侵害个人信息。这也是合法的信息处理者有义务防止他人未经授权访问个人信息的根源所在。但随着数字经济的发展,用户寄托于数据之上的个人信息权益期待,已经不再局限于免受他人不法侵害的消极防御,更有对个人信息进行积极利用的一面。当用户希望将个人信息数据在原平台之外进行积极利用,则个人信息权益的保护便可能无法再作为原平台反对数据爬取的额外“筹码”。不仅如此,由于用户明确支持数据爬取行为,数据爬取的正当性可能因用户个人信息权益而得到强化。此时,对用户个人信息权益的考量,是否足以使原本倾向数据被爬取方的天平发生倾斜,转而认可竞争性数据爬取行为的正当性,则成为至关重要的问题。

相关文章: