当前位置：首页 > Python > 正文

Python XML解析入门指南（使用xml.etree.ElementTree库轻松处理XML数据）

主机测评网
Python
2025-12-07
673

在当今的数据交换世界中，XML（可扩展标记语言）仍然是一种广泛使用的格式。无论是配置文件、Web服务响应还是文档存储，掌握如何用Python XML解析技术处理XML数据都是一项重要技能。本文将带你从零开始学习如何使用Python标准库中的 xml.etree.ElementTree 模块来读取、修改和创建XML文档。

什么是xml.etree.ElementTree？

xml.etree.ElementTree 是Python内置的一个轻量级且高效的XML处理库。它以树形结构表示XML文档，每个节点称为一个“元素”（Element），非常适合中小型XML文件的处理。

Python XML解析入门指南（使用xml.etree.ElementTree库轻松处理XML数据） XML解析 xml.etree.ElementTree教程 ElementTree使用方法 Python处理XML数据第1张

安装与导入

由于 xml.etree.ElementTree 是Python标准库的一部分，你无需额外安装任何包。只需在代码开头导入即可：

import xml.etree.ElementTree as ET

通常我们会使用 as ET 的方式简化调用，这是社区通用做法。

读取XML文件

假设我们有一个名为 books.xml 的文件，内容如下：

<?xml version="1.0" encoding="UTF-8"?><library>    <book id="1">        <title>Python编程入门</title>        <author>张三</author>        <price>59.9</price>    </book>    <book id="2">        <title>数据结构与算法</title>        <author>李四</author>        <price>78.5</price>    </book></library>

我们可以使用以下代码读取并解析它：

import xml.etree.ElementTree as ET# 从文件加载XMLtree = ET.parse('books.xml')root = tree.getroot()print(f"根元素标签: {root.tag}")  # 输出: library# 遍历所有子元素for book in root:    print(f"书ID: {book.attrib['id']}")    print(f"书名: {book.find('title').text}")    print(f"作者: {book.find('author').text}")    print(f"价格: {book.find('price').text}\n")

从字符串解析XML

有时XML数据来自网络请求或变量，这时可以使用 ET.fromstring()：

xml_str = '''<person>    <name>王五</name>    <age>30</age></person>'''root = ET.fromstring(xml_str)print(root.find('name').text)  # 输出: 王五

修改XML内容

你可以轻松地添加、修改或删除元素。例如，为每本书添加一个“库存”字段：

for book in root:    stock = ET.SubElement(book, 'stock')    stock.text = '10'# 保存修改后的XMLtree.write('updated_books.xml', encoding='utf-8', xml_declaration=True)

创建全新的XML文档

你也可以从零开始构建XML：

# 创建根元素root = ET.Element("products")# 添加子元素product = ET.SubElement(root, "product", id="101")ET.SubElement(product, "name").text = "笔记本电脑"ET.SubElement(product, "price").text = "5999"# 生成树并写入文件tree = ET.ElementTree(root)tree.write("products.xml", encoding="utf-8", xml_declaration=True)

常见问题与技巧

命名空间处理：如果XML包含命名空间（如 <ns:tag>），需在查找时使用完整URI。
编码问题：写入文件时务必指定 encoding='utf-8' 并设置 xml_declaration=True 以包含XML声明。
性能考虑：对于超大XML文件（GB级别），建议使用 xml.sax 流式解析器而非ElementTree。

总结

通过本教程，你已经掌握了 xml.etree.ElementTree使用方法 的核心操作：读取、遍历、修改和创建XML文档。作为Python处理XML数据的标准工具，xml.etree.ElementTree 简洁高效，非常适合日常开发需求。无论你是处理API返回的XML，还是读写配置文件，这些技能都能派上用场。

记住，实践是最好的老师。尝试用你自己的XML文件练习这些操作，你会很快熟悉整个流程。如果你正在寻找更高级的功能（如XPath支持），也可以考虑第三方库如 lxml，但对于大多数场景，ElementTree已经足够强大。

希望这篇 ElementTree使用方法 教程能帮助你顺利入门 Python处理XML数据！