当前位置: 首页 > 后端技术 > Python

【K哥爬虫法则科普】大众点评VS百度地图,论爬虫开发“数据所有权”的罪与罚!

时间:2023-03-26 12:22:29 Python

目前,我国还没有出台专门针对网络爬虫技术的法律规定,但在司法实践中,相关判决屡见不鲜。K哥特意开设了一个专栏《K哥爬虫法》。本栏目分析真实案例,旨在提高广大爬虫工程师的法律意识,合法合规使用爬虫技术,警钟长鸣,做一个守法护法的人,和有原则的技术人员。案件简介被告:北京百度网通技术有限公司(以下简称百度公司),上诉百度:上海瀚涛信息咨询有限公司“百度知乎”大量抄袭用户评论等未经授权,来自“大众点评网”的信息,与“百度地图”有合作关系的上海捷途软件技术有限公司运营的“城市吧”网站,使用“百度地图”也扩大了侵权范围,给公司造成重大损失,为此,“大众点评网”的运营方上海瀚涛信息咨询有限公司起诉北京百度网通有限公司、上海捷途软件技术有限公司。.以不正当竞争罪向法院起诉,要求被告停止侵权行为,并发布公告,消除侵权行为的不利影响,并赔偿经济损失9000万元及为停止侵权行为支出的45万余元铃声。本案中,北京百度网通科技有限公司(以下简称“百度公司”)利用技术手段,在大众点评等APP上抓取商户基本信息和评论信息。跳转到大众点评界面,可直接获取商家在百度地图界面的基本信息和点评信息。瀚淘公司以百度公司等关联主体构成不正当竞争为由,向法院提起诉讼。法院认为双方是否存在竞争关系?法院认为,虽然寒淘公司与百度公司运营的应用属于不同行业、不同领域、具有不同的商业模式,但双方的行为是在争夺同一网络用户群体,两者均在为用户提供商业信息。和评论信息。服务模式几乎相同,存在竞争关系。从法院的角度来看,竞争关系的认定不仅限于同行业相关主体之间的竞争关系的认定,还包括相关主体为争夺同一网络用户群而具有的竞争关系。竞争关系。这对于很多奉行“流量为王”的企业来说,是非常警示的。瀚涛是否拥有受法律保护的合法权利?法院认为,韩涛为积累评论信息付出了巨额成本。点评信息是瀚涛公司的核心竞争资源之一,为瀚涛公司带来了竞争优势。在考虑韩涛公司是否具有受法律保护的合法权利时,法院关注的是韩涛公司获取涉案数据的成本以及涉案数据给韩涛公司带来的利益。百度是否有不当行为?法院认为,百度在自身用户无法获取足够评论信息的情况下,通过技术手段从大众点评等网站获取评论信息,丰富百度地图。百度公司的这种行为违反了公认的商业道德和诚实信用原则,是非法的。在认定百度行为不公时,法院认为百度类似“搭便车”、“不劳而获”的行为违反了商业道德和诚信原则。百度的行为是否给韩淘造成了实际损失?法院认为,用户在使用百度地图查看商户信息和评论信息后,不再需要跳转到大众点评查看更多信息。百度地图实质上取代了大众点评,对汉淘公司造成了实质性的损害。对于互联网企业而言,用户流量的多少在一定程度上决定了企业在市场上的竞争力和企业价值。与判断是否存在竞争关系类似,在判断韩淘是否受到实际损害时,法院关注的是百度“拦截”了韩淘应有的网络用户浏览量,对大众点评形成实质性替代。判决法院一审判决结果:自判决生效之日起,百度公司应当立即停止不当使用汉淘公司运营的大众点评网的评论信息;百度公司赔偿瀚涛公司经济损失300万元及为制止不正当竞争支出的合理费用23万元;驳回韩涛公司剩余诉讼请求,一审案件受理费494067元,韩涛公司承担238207元,百度公司承担255860元。法院二审判决结果:维持原判,案件受理费32640元由上诉人北京百度网通科技有限公司承担。判决书https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/i...案例分析在本案中,瀚涛公司认为百度的行为是零成本获取自己的“版权内容”,造成实际损失的百度行为构成不正当竞争。代表百度的律师认为,百度是搜索功能公司,与大众点评不存在竞争关系。它所做的只是搜索相关信息并在筛选后呈现。在这个过程中,它收集了一些大众点评。信息,不存在不当行为,大众点评的Robots协议对百度开放,百度收集的信息是Robots协议允许的。二审中,上诉人韩涛的论点需要我们注意:百度利用搜索引擎抓取涉案信息不违反机器人协议,但不代表百度可以任意使用信息。合理控制别人网站的信息,会导致百度以极低的成本夺取韩涛的经营成果。我们知道,机器人协议是传统的君子协议,不具有法律效力。尽管大众点评网的Robots协议是面向百度的,但百度不能利用收集到的信息影响大众点评网,百度的行为仍属于不正当竞争行为。这种情况在很多企业中也存在。很多企业会在信息聚合平台上收集一些公开或半公开的信息,然后将这些信息应用到自己的业务场景中。犯法。但未考虑业务与信息聚合平台之间是否存在竞争关系,未考虑爬虫信息的使用范围和方式以及对信息聚合平台的影响。这也是很多个人爬虫开发者在开发爬虫时没有考虑到的。.目前,数据抓取行为涉及的竞争关系认定标准较为模糊。目前,此类案件的判断主要有三个要素:第一,行为确实合法,不是特别明确;第二,其他经营者的合法权益确实是由于竞争而产生的。第三,这种竞争行为确实不当或应受谴责,因为它违反了诚实信用原则和公认的商业道德。在这种情况下,百度的做法确实符合这三个要求。作为内容提供者,在自己的产品中展示大众点评网的信息会导致大众点评流量的流失,这是不公平的。随着数据在现代社会的重要性越来越高,数据所有权的问题也越来越重要,企业乃至国家对数据的重视程度也越来越高。《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》明确将数据作为生产要素,与土地、劳动力、资金、技术等传统生产要素并驾齐驱。因此,在爬虫开发中,我们不仅需要关注数据来源是否合法,还要考虑数据是否被正确使用。