环境python版本号系统浏览器python3.7.2win7googlechrome关于本文本文将通过爬虫实现简单的百度翻译。本文代码仅供学习,请勿用于商业用途。业务功能请到api.fanyi.baidu.com购买付费API。如有侵权,立即删除文章!实现思路是在网站文件中寻找隐藏的免费API。传入api需要的参数,并对其进行请求。在返回的json结果中找到对应的翻译结果。百度翻译的反爬机制是利用js算法生成的signcookie检测token代码,找到网站文件中隐藏的免费API,进入百度翻译,输入一段需要翻译的文字。翻译结果出来后,按F12,选择NETWORK,最后点击进入XHR文件。此时网站文件已经加载完成,需要F5刷新。刷新后,我们可以找到一个以v2transapi?开头的文件,不错,就是我们要找的api接口。我们来验证一下,点击文件-预览,可以在数据中找到json格式的翻译结果,验证成功。另外,我们还需要获取我们的cookie和token,在后续的反爬虫机制中需要用到,位置如下。cookie位置:token位置:api信息接口:https://fanyi.baidu.com/v2tra...请求方式:post请求参数集合参数介绍从源语言到目标语言查询翻译文本签名js算法生成的签名(反-crawling)tokenrequestcode开始写代码importrequestandexecjs库importrequestsimportexecjsrequestsHTTP库,用于爬虫execjs用于调用js代码反爬由于百度翻译有cookie识别反爬机制,所以我们设置起来,我们刚刚得到它的cookie来掩盖网络蜘蛛的身份。headers={'cookie':'请在此处输入您的cookie'}另外,我们还需要设置token(密码)。token='Pleaseputyourtokenhere'最后只剩下sign反爬机制了,sign是js算法生成的翻译签名。在网上搜索了一下,找到了对应的js算法,分享给大家。vari="320305.131321201"functionn(r,o){for(vart=0;t
