CSS偏移反爬虫原理及破解方法

时间：2023-03-17 11:18:08 科技观察

本文转载自微信公众号《智斌的python笔记》，作者智斌。转载本文请联系志斌python笔记公众号。大家好，我是志斌~前几天在爬某网站的时候遇到了一个CSS偏移反爬虫。它是一种反爬虫，使用CSS样式将乱序的文本格式化为人类正常的阅读顺序。今天智斌就来和大家分享如何绕过这类反爬虫。01原理在构建网页的时候，我们需要用CSS来控制各种字符的位置，正是如此。我们可以使用CSS将浏览器中显示的文本以随机的方式存储在HTML中，从而达到限制爬虫的目的。如下图，我们发现浏览器实际显示的是1226，但是HTML显示的是1262。接下来我们通过一个例子来了解如何绕过CSS偏移反爬虫。02Bypass从下图可以看出，机票价格数据被包裹在一个64px大小的标签中。如下图所示：进一步观察网页发现标签中有五个标签，每一对标签都有特定的样式。如下图所示：如果我们使用这些CSS样式来分析，我们发现第一对标签中的四对标签正好占据了标签的位置。如下图所示：在浏览器中应该显示5377，因为第二、三、四、五对标签是有值的，所以我们需要看他们的位置。第二对标签的位置样式为left:-64px，所以第二对标签中的1会覆盖第一对中第一对标签中的5>标签；第三对标签的位置样式为left:-32px，第三对标签中的2将覆盖第一对中第三对标签中的7>标签。以此类推，第四对标签中的6会覆盖第一对标签中第四对标签中的7，以及第五对标签中的2将覆盖第一对<3在第二对标签中的b>标签。通过上面的分析，我们发现CSS偏移反爬虫实际上是让CSS控制多个数据覆盖原来的数据，从而达到反爬虫的效果。那么当我们遇到这种反爬虫的时候，我们首先需要观察和分析页面的CSS，找到偏移量的计算规律，然后提取每个标签中left的值，按照真实的数据进行排列法律。当然，有读者会说我们找到规律了，但是如果提取不到标签中的数据怎么办？别着急，志斌在上一篇文章中介绍了如和用BS4提取数据的方法，包括提取标签，不了解数据方法的小伙伴可以看这篇学习BS4，轻松解决数据提取！.03小结1.CSS偏移反爬虫本质上是通过CSS样式来控制数据在页面中的显示位置，让乱序的数据以正常的形式展现给用户。2.破解这种反爬虫难度不大。主要是找到位置偏移量的计算方法，代码写起来可能比较繁琐。读者可以先把流程图写好再写。3、目前的反爬虫方法主要针对数字数据的反爬虫。4、本文旨在学习研究CSS偏移反爬虫，请勿用于非法用途。

上一篇：保护新网站的前5个步骤

下一篇：机器学习中的数学（一）-回归与梯度下降

CSS偏移反爬虫原理及破解方法相关文章

索尼全画幅无反相机A9梦想点亮科技

迪士尼公布全身力反馈服Force Jacket的原型

斐讯W3运动手环开箱图！半反半透明

新款智能外套！融合时尚、科技和触觉反馈

2018年Q1智能音箱市场！谷歌反超亚马逊，美国市场首次跌破

孙宏斌已“愿赌服输”，还是在寻求反击-

反骑318挑战泥泞路麦芒香格里拉环线骑行

揭秘丨反人脸识别，身份欺骗成功率达到99.5%

商家反馈！我有一块瑞士手表，但我使用 Apple Watch

新兵违反安全规定用智能手表拍照

Token学院“链上简报会”圆满结束，实际案例引发学员热烈反

Google 反击可穿戴产品的两个关键

Jawbone 的没落：可穿戴设备 Checkmate 会重

优点智能净水器搭载RO反渗透过滤技术，可去除高达万分之一微

Apple Watch 销量下滑，可穿戴设备市场反映悲痛

旷视科技与北京银行达成战略合作——金融服务科技，科技反哺金融

Vive Focus 是全球发布还是要看中国市场的反应

细看全球“VR第一案”的连锁反应

儿童智能手表“监控”教室引发争议，家长同意，专家反对

上半年股价暴涨50%，联发科的U型反转

最新推荐

1乌鸦的失败，百度的反思，谁买的智能音箱价格最低，谁就赢了？

2适得其反的运动手环其实让年轻人对于运动更加被动

3谈论触觉反馈技术，让你在虚拟现实世界中漫游

4预测！ 2016年手机+可穿戴设备将引发怎样的化学反应？

59.14京东相机节，尼康单反低至1999！相机爱好者的狂欢

6第三季度面板价格将反弹上涨！电视跟随上涨

7霍金警告！当心人工智能的反弹

8研究表明，佩戴AR眼镜可以减缓大脑的反应

9谷歌市值超越苹果，反映出科技行业的新趋势，

10美军正在测试神经刺激耳机！看起来像是可以提高士兵反应速度的“

猜你喜欢

1Tesla Studios 推出全身触觉反馈虚拟现实设备 T

2耳机也有触觉反馈！ Razer游戏耳机加入物理振动

3两大可穿戴设备厂商联手反击小米和苹果？

4人工智能时代巨头争夺制高点，华为的AI芯片能否反超？

5马斯克对一切都有反应？我不后悔发布私有化消息，但我不打算放弃

6Boss Vantage的半年报兼作反击，厨电行业突围靠结构

7第二届大学生智能机器人创意大赛在成都发布，拟增设格斗项目引起

8索尼全画幅无反单机 A7M3 选择索尼选择索尼全画幅无反单

9有创意很酷的东西！这个智能玩具居然可以反应宠物狗的情绪

10微软重生了！四年U型市值反转

11Google Glass政策更新：转售解锁手机违反相关政策

12京东相机节揭“系”远去！佳能品牌日系单反立减3000元！

13谁说无反相机拍不出大片？京东相机节索尼品牌日全画幅微单相机给

14中兴事件后，李克强！反对贸易战！要推动人工智能发展

15有传言称，新的Apple Watch按钮将被重新设计！改进的

16手链在红海的极端环境中仍能幸存！无声湮灭与绝地反击

17吴宓乔伟库克CSS2018腾讯安全探索论坛上演USB漏洞无硬

18为什么不能吃鸡肉？很有可能你的耳机戴反了

19斐讯智能运动手环W3发布！ 999元-首款半反半透屏

20当宗教遇上VR，会产生怎样的“反应”？