当前位置: 首页 > 后端技术 > Python

【K哥的爬虫法则】爬虫第一案,侵犯个人隐私,“入侵”短视频服务器!

时间:2023-03-26 12:37:29 Python

目前,我国还没有出台专门针对网络爬虫技术的法律规定,但在司法实践中,相关判决屡见不鲜。K哥专门开设了一个专栏“K哥爬虫普及法”。本栏目分析真实案例,旨在提高广大爬虫工程师的法律意识,合法合规使用爬虫技术,警钟长鸣,做一个守法护法的人,和有原则的技术人员。案情简介江苏省无锡市梁溪区人民法院审结一起为侵入计算机信息系统提供程序案,为流传的“短视频平台领域网络爬虫第一案”在互联网上。案件原文(来自最高人民法院):https://mp.weixin.qq.com/s/P8...2021年9月,丁某在网上结识丁某,丁某称自己有一款“爬虫”软件,可以获取某些平台用户数据,通过输入关键词搜索,可以快速抓取用户信息,主要包括用户名、评论、账号UID等,如果小丁有兴趣,可以购买代理有权推广软件并赚取差价。丁某试用后感觉不错,决定代理,“改头换面”后将软件卖掉。某信息公司员工吴先生在上网查资料时,发现有人在卖“爬虫”软件。经侦查,公安机关迅速将丁某锁定。梁溪法院经审理查明,被告人丁某在公司经营过程中向丁某(另案处理)购买了“爬虫”软件代理权,明知该软件未经授权,专门用于入侵a短视频服务器非法获取用户昵称、UID等数据,对外出售。2021年10月至12月,丁某组织公司销售人员通过网络向多人销售上述软件,违法所得共计24360元。判决法院认为,被告人丁某等人提供专门用于侵入计算机信息系统的程序,情节严重,其行为构成提供侵入计算机信息系统的程序罪。最终,法院判处被告人丁某有期徒刑1年6个月,缓刑2年,并处罚金3万元,并处没收丁某的违法所得。同时,试用期内禁止丁某从事与互联网相关的经营活动。反思总结据视频中梁溪市公安局网保大队民警介绍,被告人主要利用该软件抓取直播间用户昵称、UID等信息,并利用该信息准确联系客户,进行精准营销,如视频所示看完爬虫的相关功能,虽然不是很清楚,但还是能依稀看到如下信息:UID,SEC_UID,抖音号,姓名,性别,总消费,排名,消费水平等。另外还有采集视频,采集同城视频,查询用户,搜索用户,监控粉丝/评论,监控用户作品,热点话题,采集好物,采集直播列表、采集直播间弹幕等。值得注意的是,在视频中我们看到软件采集的名称中包含一些特殊符号,字符串也很长。可以猜测,这不是用户的真实姓名,可能是昵称之类的。作为程序员,相信大家都能看出来,案例中描述的短视频服务器入侵,其实并不是专业的描述。“入侵”应该是hacking,目的是搞到一些内部人员,或者这种情况下,打开浏览器的开发者工具,抓包到界面,就可以直接看到UID,昵称等信息,所以有没有所谓的“入侵”。突破反爬措施,破解请求参数更合理。值得注意的是,法院裁定这是对电脑的非法入侵。按道理来说,入侵的是短视频平台的服务器。平台向警方提供了哪些强有力的入侵证据?是不是可以根据一个软件就判断对方服务器被入侵了?这显然是不合理的。从工程师的角度来看,本案的重点应该是在收集用户信息后,准确联系客户,进行精准营销,这相当于侵犯了公民的个人隐私。K哥认为,本案以侵犯公民个人信息罪定罪更为合理。网上关于这个案例的文章很多,大部分都是非技术人员编辑的。文章淡化了精准触达客户、精准营销的描述,过分强调爬虫,用不专业的“入侵”字眼来形容爬虫。对于爬虫工程师来说,凡是涉及到个人信息,甚至是虚拟个人信息(指互联网产品上的用户唯一标识、昵称等)的人,都必须引起重视。一旦你的业务涉及到个人信息数据,或者通过这些数据牟利,或者通过这些数据骚扰他人,一定是违法的,你在个人信息方面必须要有这个意识。而且还有一点需要注意,本案报警的是公司员工,甚至不是发现爬虫行为报警的公司。也就是说,只要你的爬虫行为侵犯了个人隐私和他人的利益,无论数据的发布者是谁,或者数据的生产者都可以向工程师举报,所以记住,爬虫一定不能违规操作法律法规!