爬虫小工具downloader.py:文件下载助手一个可以用来下载图片、视频、文件的小工具,有下载进度显示功能。稍微修改一下就可以添加到自己的爬虫中。动态图:爬虫实战1,biqukan.py:《笔趣看》盗版小说网站,爬小说工具第三方依赖库安装:pip3installbeautifulsoup4使用方法:pythonbiqukan.py2,video_downloader:爱奇艺视频等主流视频网站VIP破解助手(暂时只支持PC和手机在线观看VIP视频!)感谢Python3二维码生成器作者:https://github.com/sylnsfar/qrcode编译好的软件下载链接:https://pan.baidu。com/s/1bqSTNJL密码:p8bs解压密码:cuijiahua.com无需Python3环境,Windows下,解压即用!软件使用方法源码可在video_downloader查看。运行源码需要搭建Python3环境,并安装相应的第三方依赖库:在video_downloader文件夹下,安装第三方依赖库:pip3install-rrequirements.txt使用方法:pythonmovie_downloader。py运行环境:Windows、Python3Linux、Python3Mac、Python33、baiduwenku.py:百度文库word文章爬取原理说明:http://blog.csdn.net/c406495762/article/details/72331737代码不完善,未打包,不通用,纯属娱乐,有空再完善。4.shuaia.py:爬取《帅啊》网,帅哥图片《帅啊》网网址:http://www.shuaia.net/index.html原理说明:http://blog.csdn.net/c406495762/article/details/72597755第三方依赖库安装:pip3installrequestsbeautifulsoup45、daili.py:搭建代理IP池原理详解:http://blog.csdn.net/c406495762/article/details/727934806,卡顿:用Scrapy爬取《火影忍者》漫画代码可以爬取整个《火影忍者》漫画所有章节的内容并保存到本地。换地址爬取其他漫画。保存地址可以在settings.py中修改。动漫网站:http://comic.kukudm.com/原理说明:http://blog.csdn.net/c406495762/article/details/728589837,hero.py:《王者荣耀》推荐装查询助手网络爬虫已经知道了,有没有想过爬取手机APP里的内容?原理解释:http://blog.csdn.net/c406495762/article/details/768508438,financial.py:财务报表下载助手爬取的数据会存入数据库吗?《跟股神巴菲特学习炒股之财务报表入库(MySQL)》可能会给你一些想法。原理说明:http://blog.csdn.net/c406495762/article/details/77801899动态示意图:9.one_hour_spider:Python3网络爬虫一小时入门。原理讲解:知乎:https://zhuanlan.zhihu.com/p/29809609CSDN:http://blog.csdn.net/c406495762/article/details/78123502本次实战内容包括:网络小说下载(静态网站)-biqukan美女壁纸下载(动态网站)-unsplash爱奇艺VIP视频下载10.douyin.py:抖音App视频下载抖音App视频下载是普通的App爬取。原理解释:个人网站:http://cuijiahua.com/blog/2018/03/spider-5.html11,抖音_pro:抖音App视频下载(升级版)抖音App视频下载,添加视频分析网站,支持无水印视频下载,使用第三方平台解析。原理解释:个人网站:http://cuijiahua.com/blog/2018/03/spider-5.html12,抖音_pro_2:抖音App视频下载(升级版2)抖音App视频下载,添加视频解析网站支持无水印视频下载,通过url解析,无需第三方平台。原理解释:个人网站:http://cuijiahua.com/blog/2018/03/spider-5.html动态图:13.geetest.py:GEETEST验证码破解爬虫最大的敌人之一是什么?没错,就是验证码!极测作为提供验证码服务的专家,拥有很高的市场占有率。如何破解极测提供的滑动验证码?授人以鱼不如授人以渔。接下来,我将为您呈现本教程的精彩内容。原理说明:http://www.cuijiahua.com/blog/2017/11/spider_2_geetest.html动态示意图:14、12306.py:使用Python抢火车票简单的代码可以自己慢慢丰富,挺简单的,用爬虫基础非常容易操作,不做原理讲解。15.baiwan:百万大侠辅助答题效果图:原理说明:http://cuijiahua.com/blog/2018/01/spider_3.html功能介绍:服务器端,使用Python抓包得到(baiwan.py)的接口获取答案数据,解析后通过百度知乎接口匹配答案,并将最终匹配结果写入文件(file.txt)。不懂手机抓包的朋友,可以看看我早期的手机APP抓包教程。Node.js(app.js)每隔1s读取一次file.txt文件,并将读取结果通过socket.io推送给客户端(index.html)。亲测回答延迟3s左右。免责声明:我从来没有做过后端和前端。花了一天的时间学习和炫耀。现在也可以看到和使用JavaScript。百度的程序只是调试。可能有很多地方使用率比较低。如果用法有误,请不要见怪。如果你有兴趣,你可以自己改进它。16、网易:根据歌单下载网易云音乐:功能介绍:根据music_list.txt文件中的歌单信息下载网易云音乐,批量下载自己喜欢的音乐。17、bilibili:bilibili视频和弹幕批量下载使用说明:pythonbilibili.py-dcat-kcat-p10三个参数:-d保存视频的文件夹名称-kB站搜索关键词-p多少页下载搜索结果前的完整代码:https://github.com/Jack-Cherish/python-spider
