在上一个计算机网络知识的阶段,我们已经学习并了解了基础网络相关基础的基础,例如TCP/IP四层协议模型,URL资源定位符号和HTTP/HTTPS协议。
众所周知,Python是一种高级语言,不仅支持GUI编程,还支持网络编程。
其中,Python构建的库提供了用于操作URL功能的URLLIB模块,并请求服务器服务库请求模块
因此,在本期中,我们使用最常用的模块Urllib模块知识来学习此问题,让我们开始?
B?URLLIB是Python中的HTTP请求库,可以在不安装的情况下使用。
Urllib非常强大,提供了许多功能如下
Urllib提供4个模块
?重要的
?Urllib.Request模块包括在各种情况下打开HTTP协议的URL方法,例如身份验证,重定向和Cookie操作。
Urllib.Request模块使用最多的场景将请求发送到服务器。
Urllib.Request模块提供请求URL通用方法如下:
urllib.request.urlopen(url,数据)打开URL。url可以是字符或请求对象urllib.request.build_opner()以串联连接该函数,然后将OpenerDirectorUlllllllllllllllllllllllllllllllllllllllllllllllllliririx返回到data.request.request.httpbasicauthhandler()处理远程host urlllib.request.request.request.proxyhandler(proxies)的身份认证的处理。
Urllib.Request模块是常用的步骤,如下:
?Urllib.Parse模块用于分析URL,并将URL字符串分为各个部分,例如协议,网络位置,路径等。
urllib.parse模块还可以使每个部分成为URL字符串,并将相对URL转换为完整且绝对的URL地址
Urllib.Parse模块定义方法URL解析和URL转编码。
Urllib.Parse解析URL的方法如下:
urllib.parse.urlparse(urlstring)URL分为方案的六部分:// netloc/path;参数?查询#fragmentwork.parse_qs(qs)分析(application/x -wwwdd -fate)给出查询字符串urllib.parse.urlnparse(parts)以解决urlurlllib.parlse.urlsplit(urlstrit(urlstring)url的元素分析的形式,-group form.url)基于组合基础和URL以组合完整的urlurllib.parse.urldefrag(url),nonlurllib.parse方法不包括片段标识符。
urllib.parse.quote(string)使用%xx过渡符号来替换特殊字符urlib.parse.urldecod(query)将字符串转换为编码的ascii text string urlib.parse解析url url url字段描述:
schemaurl协议netloc网络位置路径层路径查询查询组件片段片段用户名用户名密码密码密码主机名主机名(persicalcase)发布端口号?示例说明说明
?Urllib.Error模块专门处理由Urllib.Request引起的异常类别
Urllib.Error主要提供两个Httperror和Urlerror
urllib.error.httperror处理异常的urllib.error.urlerrorror处理程序,由HTTP错误中的HTTP错误引起。
?urllib.robotparser专门用于分析robots.txt文件的网站问题以捕获特定的URL
urllib.robotparser.robotfileparse(url)提供一系列读取,解析和回答url.parse()分析row parameters.can_fetch()如果允许用户根据规则获得URL,则返回url.parse()分析row参数。在解析文件中。在本期中,我们对Urllib库Urllib.request,Urllib.Parse,Urllib.error和Urllib.Robotparser中的四个模块有初步的理解和使用。
以上是此问题的内容。欢迎大兄弟喜欢评论?('?````````````''',下次见到????