当前位置: 首页 > 编程语言 > C#

Asp.netRequest.Browser.Crawler-动态爬虫列表?分享

时间:2023-04-10 23:14:21 C#

Asp.netRequest.Browser.Crawler–动态爬虫列表?我在C#中读到为什么Request.Browser.Crawler总是错误的(http://www.digcode.com/default.aspx?page=ed51cde3-d979-4daf-afae-fa6192562ea9&article=bc3a7a4f-f53e-4f88-8e9c-c9337f6c05a0).有没有人使用某种方法来动态更新Crawler的列表,所以Request.Browser.Crawler会非常有用?我对Ocean的Browsercaps提供的结果很满意。它支持Microsoft配置文件,无需努力检测爬虫。它甚至可以解析您网站的爬虫版本,但没有达到我真正需要的详细程度。您可以检查(正则表达式)Request.UserAgent。PeterBromberg写了一篇关于在ASP.NET中编写ASP.NET请求记录器和爬虫杀手的好文章。下面是他在Logger类中使用的方法:以上是C#学习教程:Asp.netRequest.Browser.Crawler-动态爬虫列表?如果分享的内容对你有用,需要进一步了解C#学习教程,希望你多多关注——publicstaticboolIsCrawler(HttpRequestrequest){//setnextlineto"boolisCrawler=false;使用它来拒绝某些机器人boolisCrawler=request.Browser.Crawler;//Microsoft没有正确检测到多个爬虫if(!isCrawler){//将任何其他已知的爬虫放在下面的正则表达式中//你也可以使用如果需要,此列表会拒绝某些机器人://只需设置boolisCrawler=false;对于方法中的第一行//并且在以下正则表达式列表中只包含您想要拒绝的机器人RegexregEx=newRegex("Slurp|slurp|ask|Ask|Teoma|teoma");isCrawler=regEx.Match(request.UserAgent).Success;}returnisCrawler;}本文整理自网络,不代表立场,如涉及侵权,敬请谅解点击右侧联系管理员删除,如需转载请注明出处: