前言是不是觉得XPath的用法有些晦涩难记?是不是觉得BeautifulSoup的语法有点小气难懂?您是否正在努力学习正则表达式,因为您是否为遗漏一点而疯狂?您是否已经具备一些了解选择器的前端基础知识,但对其他奇怪的选择器语法感到困惑?那么,前端大佬的福音来了,PyQuery来了,听到这个名字你一定会想到jQuery。如果你熟悉jQuery,那么PyQuery是解析文档的最佳选择!包括我!PyQuery是严格按照jQuery为模型的Python实现。语法几乎与jQuery相同,因此无需费心去记住奇怪的方法。世上有这种好事?我等不及了!安装这样的神器,赶紧安装吧!来!pipinstallpyquery参考源本文参考官方文档。更多内容可以去官方文档学习,毕竟有最正宗的。当前版本1.2.4(2016/3/24)官方文档(https://pythonhosted.org/pyquery/)介绍pyquery允许对xml文档进行jquery查询。API尽可能类似于jquery.pyquery使用lxml进行fastxml和html操作。这不是(或者至少现在还不是)生成javascript代码或与之交互的库。我只是喜欢jqueryAPI而我在python中错过了它,所以我告诉自己“嘿,让我们在python中制作jquery”。这是结果。它可以用于多种用途,我将来可能会尝试的一个想法是使用它来使用您使用pyquery修改的纯http模板进行模板化。I还可以用于网络抓取或用于Deliverance的主题应用程序。pyquery允许您使用jQuery语法来操作xml。这与jQuery非常相似。如果利用lxml,pyquery对xml和html的处理会更快。这个库不是(至少现在不是)可以与JavaScript交互的代码库,它只是非常类似于jQueryAPI。初始化这里介绍四种初始化方法。(1)直接stringfrompyqueryimportPyQueryaspqdoc=pq("")pq参数可以直接传入HTML代码,doc现在相当于jQuery中的$符号。(2)lxml.etreefromxmlxmlimportetreedoc=pq(etree.fromstring(""))可以先用lxml的etree对代码进行处理,这样如果你的HTML代码有不完整或者遗漏的地方,自动转换HTML代码以获得完整和清晰的结构。(3)直接通过urlfrompyqueryimportPyQueryaspqdoc=pq('http://www.baidu.com')这里就像是直接请求一个网页,类似于使用urllib2直接请求链接,得到html代码。(4)文件传输frompyqueryimportPyQueryaspqdoc=pq(filename='hello.html')可以直接传输某个路径的文件名。快速体验下面我们以本地文件为例,传入一个名为hello.html的文件,文件内容为
