欢迎来到中永律师事务所!

欢迎您的咨询:+86-10-57058508

业务研究

Business research

刍议北京法院两份数据抓取判决书的典型意义

时间:2022年03月16日

针对涉及数据的不正当竞争案件,律师在代理时应该回归反不正当竞争法的本质,即贯彻竞争法的理念和方法,遵循判断违法行为的基本原则,并着重按照竞争理念和标准判断被诉行为的正当性,找到合适的解决办法和思路。

摘要:

去年相关自媒体公开了北京法院两份关于数据抓取的判决书,当事人均涉及大型互联网公司。笔者发现,两份判决中都有一些新颖的观点,值得学习和研究。

此外,伴随着近年来多部涉及数据保护的法律陆续颁布,以及大数据与我们的生活和工作的关系更加紧密等原因,这两份判决的作出更加值得业内关注。笔者初步研究后,试图分析两份判决书中的典型意义,以期抛砖引玉。


一、头条起诉微博设置黑名单索赔1亿元案件

该案一审法院(北京知产法院)认定,微博实施的单方限制今日头条抓取数据的行为,违反了公平竞争、诚实信用原则和互联网行业公认的商业道德,属于不正当竞争行为。

二审法院(北京高院)则给出了相反的结论,认定微博实施的被诉行为属于企业实施自主经营权的行为,在不损害消费者利益、公共利益、竞争秩序的情况下,应当被允许,被诉行为不构成不正当竞争。

笔者认为:北京高院的观点看似与之前的司法观点有所区别。但是细思之后,判决的观点恰恰回归了反不正当竞争法的本质,即反不正当竞争法不是权益保护法,而是一种行为法。其立足点在于对不正当竞争行为的规制,从而到达维护市场竞争秩序的目的。在判断违法性时,应当从被诉行为的本身进行判断,而不是当然设定一个在先权益,进而判断被诉行为是否侵犯该在先权益。

(一)一审判决 

1.案号:(2017)京73民初2020号 

2. 案件事实:

自2017年起,字节跳动公司(今日头条新闻app的运营公司)声称,微梦创科公司(微博社交平台的运营公司)在其运营的微博中设置黑名单,限制今日头条抓取微博社交平台的相关网页数据,并且该限制黑名单仅针对今日头条一家新闻客户端。今日头条认为微博的行为构成不正当竞争,遂向法院起诉,一审法院支持了字节跳动公司的请求,二审法院最终撤销一审判决,驳回诉讼请求。

3. 裁判理由: 

首先,微博在网站robots协议中,以文字宣示方式单方限制今日头条的网络机器人抓取对公众,以及其他网络机器人完全公开的网页内容,降低了今日头条平台的用户体验,影响了网络用户对平台的市场评价,损害了字节跳动公司的合法权益。

其次,微博实施的单方限制行为,影响了网络用户选择“今日头条”客户端的正常使用,且在一定程度上迫使存在信息检索需求的网络用户,选择其他平台获取信息,增加了网络用户选择成本,损害了网络用户的合法权益。 

最后,robot协议设立初衷是为了引导网络机器人有效抓取网络用户的信息,从而促进信息共享。微博作为互联网信息服务经营者,应当坚持诚实信用原则,公平对待其他经营者。

综上所述,微博实施的被诉行为阻碍了网络信息的正常流动,与互联网行业普遍的原则相悖,损害了网络市场的竞争秩序,属于不正当竞争行为。

在该案中,一审法院同时强调《互联网搜索引擎服务自律公约》可以作为认定互联网行业公认商业道德的参考。

(二)二审判决

 

1. 案号:(2021)京民终281号

 

2. 上诉请求:

微博不服一审判决,认为应该撤销一审判决,驳回字节跳动公司的诉讼请求,具体上诉请求如下所述:

(1)认定被诉行为:“导致字节跳动公司网络机器人无法正常抓取相关信息”,从而认定被诉行为具有损害后果,属于认定事实错误;

(2)“ToutiaoSpider”不是搜索引擎网络机器人,一审判决认为被诉行为会对用户检索需求造成影响,具有不正当性,属于认定事实错误;

(3)即使被诉行为构成不正当竞争,微博公司也不应承担消除影响的责任;

(4)被诉行为持续到2019年《中华人民共和国反不正当竞争法》修订之后,本案应适用2019年反不正当竞争法,一审判决适用法律错误;

(5)被诉行为已经停止,一审判决不应再判令停止被诉行为。

3. 裁判理由:

首先,分析搜索引擎应用场景的功能可知,其与公众利益,以及对于互联网互联、互通、共享、开放的精神密切相关。robots协议最初也是针对搜索引擎提出的,并已经成为国内外搜索引擎行业普遍遵守的技术规范,即网站的所有者允许或者禁止网络机器人抓取其网站的内容,而非搜索引擎场景的网络机器人。

已经不像传统搜索引擎那样对公众利益,以及互联网的互联互通的精神产生益处,在对这些网络机器人通过robots协议进行限制时,不能当然地借用对于搜索引擎进行限制的规则。即《互联网搜索引擎服务自律公约》仅可作为搜索引擎服务行业的商业道德,而不能成为互联网行业通行的商业道德。

笔者批注:个人认为,该案二审判决的观点提到的网络机器人仅限于传统的搜索引擎网络机器人【如百度、必应等】。

另外,此种机器人就是内置于各种网络应用app之中,同样具有搜索引擎功能的版块或者功能,诸如微信中的“搜一搜”功能、微博中的“微头条”、今日头条中的搜索功能等。

具体到本案中,根据证据显示,微博限制的“ToutiaoSpider”网络机器人的应用场景并不是搜索引擎场景,而是“微头条”等非搜索引擎应用场景。因此,一审判决将《互联网搜索引擎服务自律公约》作为本案中商业道德的参考显有不妥。

其次,判断robots协议对于网络机器人限制行为的正当性时,核心在于保护网站经营者的自主经营权,与维护其他经营者利益、维护消费者利益、维护竞争秩序之间的平衡,对本案被诉行为是否具有正当性的判断,应该从以下几个方面分析:

(1)robots协议的设置初衷,主要为了防止被抓网站的服务器过载影响网站正常运行,以及防止抓取内部信息和对网络用户没有价值的信息。但是随着网络机器人应用场景的不断扩展,在非搜索引擎应用场景下,机器人往往抓取其他网站公开的各种数据,甚至是其他网站自行生成的数据,直接用于自己的商业行为。

尽管robots协议客观上会造成对某个经营者的“歧视”,但是在不损害消费者利益、不损害公共利益、不损害竞争秩序的情况下,应当允许网站经营者通过robots协议对其他网络机器人的抓取进行限制,这是网站经营者经营自主权的体现。鉴于此,通过robots协议对网络机器人进行限制并不当然违背互联网的商业道德。

(2)互联网行业中的信息自由流动应该控制在合理范围内,需要符合互联网行业的商业道德,否则将不利于鼓励商业投入与创新。

(3)字节跳动公司自己网站上也明示,其他网站经营者可以根据robots协议拒绝其抓取。

(4)反不正当竞争法不是权益保护法,其对互联网行业的竞争行为进行规制时,不应过多考虑静态利用和商业成果,而应立足于竞争手段的正当性和竞争机制的健全性,更应考虑市场竞争的根本目标。

对于网站经营者通过robots协议限制其他网站网络机器人抓取的行为,不应作为一种互联网经营模式进行绝对化的合法性判断。而应结合robots协议设置方与被限制方所处的经营领域和经营内容、被限制的网络机器人应用场景、robots协议的设置对其他经营者、消费者以及竞争秩序的影响等多种因素进行综合判断。鉴于此,本案被诉行为应被认定为行使企业自主经营权的行为,但这并不意味着对于互联网企业所设置的任何robots协议均能够基于企业自主经营权而当然地认定其具有正当性。

最后,北京高院认为,被诉行为属于微博企业自主经营权范畴内的正当行为,并不构成不正当竞争行为。

(三)笔者观点

笔者愚见,本案判决从事实认定和法律分析方面,均有很多新颖独特之处,具体内容简述如下:

1. 区分网络机器人的应用场景:

(1)搜索引擎应用场景(百度、必应等)

其作用是将符合网络用户希望搜索的信息挑选出,按照匹配度高低依次列出,供用户选择。此外,该场景可以给被搜网站带来流量和利益,提高公众用户利益,以及对互联网“互联、互通、共享、开放”的精神起到积极作用;

(2)非搜索引擎应用场景(微博中的“微头条”版块等一些网络app中具有搜索功能的版块)

其主要作用并非是方便用户在公共区域互联网中选择网页信息,多数是为了方便用户在自己的应用app中选择网络信息。此外,该场景通常也会带走或者分流被搜网站的流量,与互联网的互联、互通的精神存在差异。

2. 明确《互联网搜索引擎服务自律公约》的行业地位:其仅属于搜索引擎服务行业的商业道德,而不是互联网行业通用的商业道德,即该公约也不是非搜索引擎应用场景领域中的商业道德;

3. Robots协议的设立目的:自设立之初至今,针对的均是搜索引擎应用场景的网络机器人,并不针对、限制新型的非搜引擎应用场景网络机器人;

4. 判断robots协议对网络机器人限制行为的正当性时,应综合考虑并平衡下述几方面利益:

(1)网站经营者的自主经营权;

(2)其他经营者、消费者利益;

(3)市场竞争秩序。

5. 强调反不正当竞争法的地位:不是权益保护法,而是应该聚焦某个行为的正当性。对竞争行为进行规制时,不应过多考虑在先存在的静态利益,而应从判断竞争手段的正当性和竞争机制的健全性出发,同时应考虑市场竞争的根本目标。

二、微博起诉蚁坊公司“鹰击系统”软件非法抓取并使用数据案件该案一审法院(北京市海淀区人民法院)认定,蚁坊公司对微博内容进行获取、存储和展示,并基于这些数据形成数据分析报告,损害了微博的合法权益。蚁坊公司实施的被诉行为具有不正当性,破坏了微博的正常运行,违反了反不正当竞争法第十二条第二款第四项的规定,构成不正当竞争。

二审法院(北京知产法院)认可一审判决的观点,驳回了蚁坊公司的全部上诉请求。

笔者批注:个人认为,本案中,法院在判断蚁坊公司实施的被诉行为是否属于不正当竞争行为时,总体上的观点与上述微博案件一致,即从被诉行为本身的正当性判断,同时考虑行为导致的损害后果,而并没有当然设定一个在先权益,进而判断被诉行为是否侵犯了该在先权益。

该案判决的具体内容如下所述: 

(一)一审判决

 1. 案号:(2018)京0108民初28643号

 2. 案件事实:

微梦公司是“微博”平台的运营者及服务提供者,对微博数据享有依据《反不正当竞争法》保护的权益。蚁坊公司是“鹰击系统”的开发、运营公司。

微博公司认为“鹰击系统”未经许可擅自抓取、展示、应用、分析新浪微博数据的行为构成不正当竞争行为。

蚁坊公司则认为获取信息是后续展示、使用等行为的基础和前提。因此,本案应判断“鹰击系统”获取新浪微博数据的方式是否具有不正当性。而“鹰击系统”获取微博数据的渠道有两个:一是通过登录数据接口账户获取高权限的新浪微博数据,而该数据接口是2011年在国务院新闻办公室的协调下,由新浪微博的运营方提供的,至今仍然能够使用;二是通过网络爬虫技术,抓取新浪微博公开的数据后予以集成。蚁坊公司认为前述两种方式均属于合法渠道获取。因此,其实施的行为不构成不正当竞争。 

最终,一、二审法院均认为蚁坊公司实施的行为构成不正当竞争,需赔偿微博经济损失500万元。

3. 裁判理由:

本案一审判决从下述几个方面论述了具体理由: 

(1)微梦公司和蚁坊公司之间是否存在竞争关系 

在当前反不正当竞争法框架下,判断经营者自建是否构成不正当竞争时,仍然需要判断二者是否存在竞争关系。只不过目前司法实践的“竞争关系”趋于广义化定义,即只要经营者的行为不仅具有对其他经营者利益造成损害的可能性,且其同时会基于该行为获得现实或潜在的经济利益,则可以认定二者具有竞争关系。 

具体到本案中,虽然蚁坊公司经营的鹰击系统所提供的服务系与社交平台存在一定差异,但微梦公司对其所主张的微博平台后端数据享有权益,其基于运营微博平台过程中所合法收集和积累的数据亦可自己开展或向第三方授权使用而从事数据分析服务。基于微博开展的前述数据分析服务,从而导致微梦公司与蚁坊公司存在广义上的竞争关系。

此外,蚁坊公司的被诉行为在未付成本即获得现实利益的同时,会减损微梦公司利用该部分数据而可能获得的经营利益,二者之间的经营利益显然存在“此消彼长”的关系。 

(2)蚁坊公司实施被诉行为性质的判断

一审法院从下述几个方面论述了被诉行为具有不正当性,具体内容如下所述: 

【1】微博平台数据的类型区分

一审法院认为虽然原、被告双方均使用“前端数据”和“后端数据”区分微博平台数据。但是,从技术角度看,使用前述概念进行区分数据,或可能存在范围重叠额情形,或可能出现分类不严谨的问题。因此,一审法院认为从规范层面看,将微博平台数据分为“公开数据”和“非公开数据”更为合适。 

【2】蚁坊公司抓取微博平台数据类型及行为的性质 

判断蚁坊公司抓取数据的行为是否构成不正当竞争,关键在于判断其抓取的数据是公开数据还是非公开数据。一审法院从如下几个方面认定蚁坊公司抓取微博平台数据属于非公开数据: 

A. “鹰击系统”中展示的新浪微博发布时间较之微博平台前端的发布时间更为精确; 

B. 法庭勘验显示,在用户未登录状态下,仅可查看数量有限的新浪微博,仅可使用有限的微博平台功能,用户登录后才可访问到更多数据,使用更多功能; 

C. 微博平台用户发布微博后自行删除或因其他原因被删除的微博,用户即便在登录状态下亦无权限查看,但这部分数据却可在鹰击系统中得到展示。 

基于上述内容,一审法院认定蚁坊公司抓取的微博平台数据包括微梦公司已设置了访问权限的非公开数据。 

【3】蚁坊公司使用微博平台数据是否具有不正当性 

如上所述,因蚁坊公司抓取微博平台数据的行为存在不正当性。因此,将这部分数据用于“鹰击系统”展示和进行分析的后续使用行为也具有不正当性(因数据来源不合法而不具有正当性之基础)。 

此外,微博平台中对这些数据设定了特定的展示规则(如不能在博主主页中查看到其对他人微博的评论和评论内容),蚁坊公司改变该种规则而在鹰击系统中更改该部分数据的呈现方式(如可直接展示博主微博和其对他人微博的评论),亦具有不正当性。

(3)被诉行为是否使得微梦公司受到损害 

一审法院从如下四个方面认定蚁坊公司实施的被诉行为使微梦公司遭受损害:

A. 根据微博的相关协议及民法权利义务对等的原则,微梦公司对微博平台数据享有权益的同时必然要负担维护数据运行,保护用户数据安的对等义务。而蚁坊公司的被诉行为,必然会影响微梦公司的前述权利和义务; 

B. 蚁坊公司通过非正常手段抓取微博平台公开数据,以及破坏或绕开微梦公司对非公开数据采取的保护措施而抓取非公开数据,且在“鹰击系统”中改变新浪微博的展示形式,改变了微梦公司为数据设定的访问和展示规则,影响了微博产品的运行; 

C. 蚁坊公司实时抓取大量微博平台数据,也会给平台服务器的正常运行造成额外负担,提高微梦公司的运营成本;

D. 微梦公司就微博平台数据已与案外人开展合作,蚁坊公司的被诉行为必然会影响微梦公司对外授权并获得相关收益。 

最后,综合上文所述,一审法院认为涉案被诉行为具有不正当性,破坏了微博平台的正常运行。

(二)二审判决

1. 案号:(2019)京73民终3789号

2. 上诉请求:蚁坊公司不服一审判决,认为应该撤销一审判决,驳回微梦公司的全部诉讼请求,具体上诉请求如下所述:

(1)蚁坊公司与微梦公司不存在竞争关系;

(2)本案实质上是微梦公司意图滥用市场支配地位、排除限制像蚁坊公司一样的网络舆情控制工具提供商;

(3)根据监管部门履行职责的需求和要求,“鹰击系统”自2011年起作为监管工具对境内外微博平台进行监管,该系统对数据的获取和处理正当合法,不存在不当行为;

(4)“鹰击系统”是国家监管部门进行网络监管的合法工具,未损害微梦公司利益,一审判赔数额与事实不符。

3. 裁判理由:

二审法院认为本案的争议焦点为:蚁坊公司开发的鹰击系统通过何种方式获取微梦公司的大量微博数据,这种获取方式是否属于反不正当竞争法所禁止的不正当竞争行为。根据该焦点问题,一审法院从以下几个方面论述了具体理由:

(1)微梦公司与蚁坊公司是否存在竞争关系;

《反不正当竞争法》旨在制止不正当竞争行为,维护合法有序的市场竞争秩序,对于竞争关系不应作狭义的理解和限制,现代市场中的竞争关系不仅包括同业竞争,也包括不同经营者对同一经营资源或交易机会进行争夺的情形。

具体到本案中,虽然微梦公司与蚁坊公司的经营领域不同,但二者重要的经营资源均包含新浪微博数据,而微梦公司又对微博数据进行了大量的投入,从而使得其具有商业价值。基于此,使得微梦公司与蚁坊公司之间存在竞争关系。

(2)蚁坊公司获取新浪微博数据的方式是否合法

二审法院认同一审法院的观点,认定蚁坊公司获得微博数据的两种方式均不具有合法性。由于其获取数据的方式不合法,进而导致其后续的分析、展示等使用行为也不具有合法性。

(3)一审判决对法律责任的认定是否不当

一审法院认定蚁坊公司通过不正当方式获取新浪微博数据的认定并无不当,进而在此基础上对数据的使用、展示、分析行为亦不具有正当性。

此外,一审法院综合考虑“鹰击系统”开展服务的时间跨度、用户规模以及主观过错等方面,酌情认定的经济损失数额以及合理支出数额也符合事实基础。

综上所述,二审法院认为蚁坊公司的上诉请求不能成立,依法应予以驳回。

(三)笔者观点

本案判决整体上的观点与上述微博案件大致相同,但仍有如下事实和法律认定的新颖之处:

1. 区分微博平台数据类型:

(1)公开数据;(2)非公开数据。

根据判决书的内容,公开数据可简单理解为,数据持有方没有施加任何限制手段即可访问的数据,非公开数据就是施加了访问限制的数据。

笔者认为,上述这种对数据新颖的分类方法,可以适用于之后大部分平台类公司涉及数据抓取的不正当竞争案件中。

2. 认定抓取平台类公司数据行为的性质

判断抓取数据行为是否构成不正当竞争,最重要的是判断抓取的数据是公开数据还是非公开数据。在被诉行为抓取的数据是非公开数据的前提下,该行为极有可能会被认定构成不正当竞争。

与此同时,在抓取行为被认定属于不正当竞争行为的前提下,后续涉及数据的使用行为也极有可能被认定具有不正当性(因数据来源不合法而不具有正当性之基础)。

3. 网络不正当竞争纠纷中,判断被诉行为是否属于不正当竞争行为,还是应该回归反不正当竞争法的本质,综合考虑如下几个方面:

(1)判断双方是否具有竞争关系,当然该竞争关系应该作广义的理解;

(2)判断被诉行为是否具有不正当性;

(3)被诉行为是否使得相对方受到损害。笔者认为,在考虑此项要件时,还应该综合考虑损害程度、对消费者利益、以及竞争秩序的影响程度。

三、结语

近年来,涉及数据的不正当竞争案件数量呈现稳步上升趋势。虽然,这类案件涉及一些新型的法律问题和被诉行为,但律师及相关从业者在处理案件时,也不用望而生畏。只要回归反不正当竞争法的本质,即贯彻竞争法的理念和方法,遵循判断违法行为的基本原则,以及着重按照竞争理念和标准判断被诉行为的正当性,就能够找到合适的解决办法和思路。