数字经济时代,互联网企业对数据资源争夺激烈,由数据权益归属和数据抓取行为引起的争议在全世界范围内层出不穷。近日,美国联邦最高法院撤销了hiQ诉LinkedIn关于临时禁令的二审判决并发回第九巡回法院重审。作为美国近年来公开数据抓取相关的典型案例,此案带来的讨论是:对于开放性社交或内容平台上允许自由访问的用户数据,平台是否能够限制其他运营者通过爬虫等技术手段进行抓取和使用?
美国hiQ诉LinkedIn案件
该案的背景是,数据分析公司hiQ利用爬虫软件抓取LinkedIn用户的公开个人资料,包括姓名、职位、工作经历和专业技能等,利用这些信息进行算法分析并将结果出售给雇主公司。LinkedIn向hiQ发函要求停止访问和复制其服务器上的数据,称hiQ的数据抓取行为违反包括《计算机欺诈及滥用法案》(CFAA)在内的联邦和州法律,并采取了一系列措施阻止hiQ访问其网站。hiQ提起诉讼并寻求临时禁令,即要求禁止LinkedIn采取任何法律或技术措施阻止hiQ访问公开资料。该禁令获得了原审法院的支持,理由是,LinkedIn上允许自由访问的公开信息不落入CFAA的保护范围,hiQ的抓取行为不构成“未经授权的访问”,同时,如果让积累了大量用户数据的企业自由决定谁可以获取和使用数据,可能带来不公平竞争的结果。
“hiQ案”此番被发回重审,以及后续还将面临的实体审理,使得法院有机会进一步厘清公开数据权益的归属和数据抓取行为的合法性边界等诸多问题。在目前所有涉及网络公开数据抓取的讨论中,数据权益的归属既是起点,也是最大的争议所在——这些数据由用户产生、由平台收集和控制、向公众公开,究竟应归属个人所有、平台所有还是公共所有,至今众说纷纭,亦有观点主张数据权益保护的问题上界权成本过高,应当思考其他出路。
现行中国司法实务
现阶段中国司法的语境下,同类的案件一般被置于《反不正当竞争法》的分析框架,在一定程度上避开了对于公开数据权利归属作出定论。企业主张其基于运营行为取得的数据是其重要的商业资产和竞争资源,应当受到法律保护,这一点已经被法院普遍认可。在此基础上,围绕《反不正当竞争法》一般条款的分析将焦点集中在数据抓取和使用行为正当性的评价,考虑被抓取方获得数据的难易程度、是否对数据进行加工处理等、是否通过爬虫协议或技术措施限制第三方抓取、抓取方是否不劳而获地通过直接获取对方资源提供同质化的产品等因素。早年的“大众点评诉百度案”,近期涉及内容移植的“抖音诉刷宝案”,法院都从上述角度进行讨论。
但数据抓取的不正当竞争案件往往容易强调经营者的竞争权益,而忽视“用户同意”在数据获取和流通(无论是经授权还是未经授权)中的作用。作为原始数据的所有者,用户将信息在网络上公开并不意味着该用户同意第三方以任何目的收集和使用这些数据。用户对于数据流向和用途的意愿应置于平台方的商业利益之上进行考量。在“微博诉脉脉案”中,法院确立了第三方通过Open API获得个人信息时的“用户授权+平台授权+用户授权”的原则。但对于非个人信息类的数据,用户意愿与平台利益的矛盾更隐蔽也更棘手。例如,如果用户认可或授权第三方平台获取数据,原平台是否有义务为数据转移提供便利?而如果原平台坚持禁止该第三方访问和使用,抓取方是否能够因为用户同意而免责?近期“微博诉今日头条案”的争议就触及到这一问题。
“hiQ案”还提供了从反垄断法出发的思考路径。如果被抓取方控制了对其竞争对手的商业模式来说是必要的数据,而这种商业模式及其提供的差异化的产品能够增加公众的福利,那么阻止他人获取此类公开数据是否可能造成限制竞争甚至是数据垄断?
数据竞争类案件之所以复杂,是因为不仅在数据类型、表现形式、使用方式等层面存在众多的讨论维度,而且涉及到商业利益与用户选择、数据开放共享与数据安全的价值衡量问题。平台通过经营积累的数据内容和资源优势固然应当保护,但也需要充分评估消费者、经营者以及社会公众的利益平衡,防止过度保护可能带来的数据壁垒。至于实践中出现的诸多具体争议,仍有待未来立法与司法的发展完善能够建立更为清晰的讨论框架和规范指引,亦便利企业进行更有针对性的数据合规实践。
元合律师事务所合伙人王亚西、律师武悦
Yuanhe Partners
58F, Fortune Financial Center (FFC)
5 Dongsanhuan Zhonglu, Chaoyang District
Beijing 100020, China
电话: +86 10 5733 2388
传真: +86 10 5733 2399
电邮: