PythonXML解析什么是XML?XML代表可扩展标记语言。您可以从此站点学习XML教程XML旨在传输和存储数据。XML是一组定义语义标记的规则,这些标记将文档划分为多个部分并标识这些部分。它也是一种元标记语言,即定义其他领域特定的、语义的和结构化的标记语言的句法语言。Python的XML解析常用的XML编程接口有DOM和SAX。这两个接口处理XML文件的方式不同,当然使用场合也不同。Python有三种解析XML、SAX、DOM、ElementTree的方法:1.SAX(simpleAPIforXML)Python标准库中包含了一个SAX解析器,SAX在这个过程中使用事件驱动模型逐一触发事件解析XML。调用用户定义的回调函数来处理XML文件。2、DOM(DocumentObjectModel)将XML数据解析成内存中的一棵树,通过操作树来操作XML。3.ElementTree(元素树)ElementTree就像一个轻量级的DOM,拥有方便友好的API。代码易用性好,速度快,占用内存少。注:由于DOM需要将XML数据映射到内存中的一棵树,一个比较慢,一个比较耗内存,而SAX流式读取XML文件,速度更快,占用内存更少,但是需要用户自己实现一个回调函数(处理程序)。本章节使用的XML实例文件movies.xml内容如下:movies.xmlWar,ThrillerDVD2003PG10聊美日战争动漫、科幻DVD1989R8A科幻小说动漫,动作DVD4PG10VashtheStampede!喜剧VHSPG2可观看boredompython使用SAX解析xmlSAX是一个事件驱动的API,使用SAX解析XML文档,涉及两部分:解析器和事件处理器。解析器负责读取XML文档并将事件发送给事件处理程序,例如元素开始和元素结束事件。事件处理程序负责响应事件和处理传递的XML数据。1、处理大文件;2.只需要文件的一部分,或者只需要从文件中获取特定的信息。3.当你想建立自己的对象模型时。在python中使用sax处理xml,首先要在xml.sax中引入parse函数,在xml.sax.handler中引入ContentHandler。ContentHandler类方法介绍了characters(content)方法的调用时机:从一行开始,遇到标签之前,有字符,content的值为这些字符串。从一个标签开始,直到遇到下一个标签,都是字符,content的值就是这些字符串。从一个标签开始,一直到遇到行结束符,都是字符,content的值就是这些字符串。标签可以是开始标签或结束标签。文档启动时调用startDocument()方法。当解析器到达文档末尾时调用endDocument()方法。遇到XML开始标记时调用startElement(name,attrs)方法。name是标签的名称,attrs是标签的属性值字典。遇到XML结束标记时调用endElement(name)方法。