各位小伙伴们好,今天给大家推荐的开源项目是:fake-useragent,这个开源项目对搞爬虫业务的人来说是个福利,大家不用去自己动手构建自己的UA池,只需要调用相应的方法即可,简单易用。感兴趣的朋友不妨下载试试。使用方法fromfake_useragentimportUserAgentua=UserAgent()ua.ie#Mozilla/5.0(Windows;U;MSIE9.0;WindowsNT9.0;en-US);ua.msie#Mozilla/5.0(compatible;MSIE10.0;Macintosh;IntelMacOSX10_7_3;Trident/6.0)'ua['InternetExplorer']#Mozilla/5.0(兼容;MSIE8.0;WindowsNT6.1;Trident/4.0;GTB7.4;InfoPath.2;SV1;.NETCLR3.3。69573;WOW64;en-US)ua.opera#Opera/9.80(X11;Linuxi686;U;ru)Presto/2.8.131Version/11.11ua.chrome#Mozilla/5.0(WindowsNT6.1)AppleWebKit/537.2(KHTML,喜欢Gecko)Chrome/22.0.1216.0Safari/537.2'ua.google#Mozilla/5.0(Macintosh;IntelMacOSX10_7_4)AppleWebKit/537.13(KHTML,喜欢Gecko)Chrome/24.0.1290.1Safari/537.13ua['googlechrome']#Mozilla/5.0(X11;CrOSi6862268.111.0)AppleWebKit/536.11(KHTML,likeGecko)Chrome/20.0.1132.57Safari/536.11ua.firefox#Mozilla/5.0(WindowsNT6.2;Win64;x64;rv:16.0.1)Gecko/20121011Firefox/16.0.1ua.ff#Mozilla/5.0(X11;Ubuntu;Linuxi686;rv:15.0)Gecko/20100101Firefox/15.0.1ua.safari#Mozilla/5.0(iPad;CPUOS6_0likeMacOSX)AppleWebKit/536.26(KHTML,likeGecko)Version/6.0Mobile/10A5355dSafari/8536.25#andthebestone,randomviarealworldbrowserusagestatisticua.random#Mozilla/5.0(Macintosh;IntelMacOSX10_10_1)AppleWebKit/537.36(KHTML,likeGecko)Chrome/37.0.2062.124Safari/537.36notesfake-useragent将收集的数据存储在你的操作系统中目录,例如/tmp如果只想更新已保存的数据库:fromfake_useragentimportUserAgentua=UserAgent()ua.update()如果不想缓存数据库或没有可写文件系统:fromfake_useragentimportUserAgentua=UserAgent(cache=False)有时useragentstring.com或w3schools.com会更改其html或向下更改,在这种情况下,如果您不想使用托管缓存服务器(在版本0.1.5中添加),则fake-useragent使用herokufallbackfromfake_useragentimportUserAgentua=UserAgent(use_cache_server=False)在极少数情况下s,fake-useragent如果hostedcacheserver和origin不可用会下载数据失败:(0.1.3版本新增)fromfake_useragentimportUserAgentua=UserAgent()#traceback(mostrecentcalllast):#...#fake_useragent.errors.FakeUserAgentError#你可以通过afr捕获omfake_useragentimportFakeUserAgentErrortry:ua=UserAgent()exceptFakeUserAgentError:pass如果您尝试获取未知浏览器:(在版本0.1.3中更改)fromfake_useragentimportUserAgentua=UserAgent()ua.best_browser#Traceback(最近调用最后):#...#fake_useragent.errors.FakeUserAgentError您可以通过添加以下内容来完全禁用任何烦人的异常回退:(添加了0.1.4版)importfake_useragentua=fake_useragent.UserAgent(fallback='YourfavoriteBrowser')#以防万一错了,再来一次真的是!!!rarecaseua.random=='YourfavoriteBrowser'想控制数据文件的位置?(新增版本0.1.4)importfake_useragent#我很坚强!!!建议使用版本suffixlocation='/home/user/fake_useragent%s.json'%fake_useragent.VERSIONua=fake_useragent.UserAgent(path=location)ua。randoms如果您需要使用__getattr__方法保护某些属性不覆盖UserAgent中的某些属性,您可以在safe_attrs中传递属性名称至少这将防止您在找不到属性时引发FakeUserAgentError。例如,使用带注入的fake_useragent时,需要:importfake_useragentua=fake_useragent.UserAgent(safe_attrs=('__injections__',))如果你不明白为什么需要它,请不要使用它。这在极少数情况下很神奇。遇到问题???确保您使用的是最新版本!pipinstall-Ufake-useragent通过python控制台查看版本:(新增0.1.4版本)importfake_useragentprint(fake_useragent.VERSION)安装pipinstallfake-useragent开源地址:https://github.com/hellysmile...喜欢今天的推荐吗?如果喜欢,请在文章底部留言或点赞,表示对我的支持。您的评论、点赞、转发和关注是我持续更新的动力!关注公众号回复:“1024”免费领取海量学习资源,先到先得!
