在Python中漂亮地打印XML

2023年 9月 7日 67.2k 0

在Python中漂亮地打印XML

在Python中处理XML数据时,确保其可读性和结构可以极大地增强代码的理解和可维护性。对XML进行漂亮打印,即使用适当的缩进和换行进行格式化,是实现这些目标的有价值的技术。

在本文中,我们将探索两种使用 Python 漂亮打印 XML 的不同方法:xml.dom.minidom 和 xml.etree.ElementTree。通过了解这些方法,开发人员可以有效地以有组织且具有视觉吸引力的方式呈现 XML 数据,从而更轻松地进行分析和操作。

如何在Python中漂亮地打印XML?

下面是我们可以在 Python 中执行漂亮打印的两种方法 -

方法一:使用xml.dom.minidom

以下是我们将使用xml.dom.minidom执行漂亮打印的步骤 -

  • 导入所需的模块:我们首先导入“xml.dom.minidom”模块,该模块提供用于 XML 解析的文档对象模型 (DOM) API 的轻量级实现。

  • 定义`pretty_print_xml_minidom`函数:该函数接受一个XML字符串作为输入,并负责使用`xml.dom.minidom`解析和美化打印XML。

  • 解析XML字符串:在`pretty_print_xml_minidom`函数内部,我们使用`xml.dom.minidom.parseString()`方法解析XML字符串并创建DOM对象。

  • 漂亮打印 XML:接下来,我们在 DOM 对象上使用“toprettyxml()”方法来生成漂亮打印的 XML 字符串。我们传递值为“””的“indent”参数来指定所需的缩进级别(本例中为两个空格)。

  • 删除空行:默认情况下,`toprettyxml()` 在输出中添加空行。为了删除这些空行,我们用换行符 (`n`) 分割漂亮的 XML 字符串,删除每行中的任何前导或尾随空格,然后将非空行重新连接在一起。

  • 打印漂亮的 XML:最后,我们打印生成的漂亮的 XML 字符串。

程序2:使用xml.etree.ElementTree

以下是我们使用 xml.etree.ElementTree 执行漂亮打印时将遵循的步骤 -

  • 导入所需模块:我们首先导入`xml.etree.ElementTree`模块,该模块提供了一个快速高效的API,用于解析和操作XML。

  • 定义`indent`函数:这是一个自定义函数,用于递归地向XML元素添加缩进。它接受一个`elem`参数(XML元素)和一个可选的`level`参数来指定当前的缩进级别(默认为0)。

  • 缩进 XML:在 `indent` 函数中,我们通过修改 `text` 和 `tail` 添加缩进> XML 元素的属性。 `text` 属性表示紧接开始标记之后的文本,`tail` 属性表示紧接结束标记之前的文本。通过向这些属性添加缩进,我们实现了漂亮的打印。

  • 定义 `pretty_print_xml_elementtree` 函数:此函数将 XML 字符串作为输入,并负责使用 `xml.etree.ElementTree` 解析和漂亮打印 XML。

  • 解析XML字符串:在`pretty_print_xml_elementtree`函数内部,我们使用`ET.fromstring()`方法解析XML字符串并创建一个ElementTree对象。

  • 缩进 XML:我们在 XML 的根元素上调用 `indent()` 函数,以递归方式向所有元素添加缩进。

  • 将 XML 元素转换回字符串:我们使用 `ET.tostring()` 方法将 XML 元素转换回字符串表示形式。我们传递值为 `"unicode"` 的 `encoding` 参数,以确保结果字符串的正确编码。

  • 打印漂亮的 XML:最后,我们打印生成的漂亮的 XML 字符串。

这两个程序提供了不同的方法来实现XML的漂亮打印。第一个程序利用`xml.dom.minidom`提供的DOM API来解析和漂亮打印XML,而第二个程序使用`xml.etree.ElementTree`模块,并定义了一个自定义函数来递归地为XML元素添加缩进。

以下是使用上述两种方法的程序示例 -

方案1:使用xml.dom.minidom

import xml.dom.minidom

def pretty_print_xml_minidom(xml_string):
# Parse the XML string
dom = xml.dom.minidom.parseString(xml_string)

# Pretty print the XML
pretty_xml = dom.toprettyxml(indent=" ")

# Remove empty lines
pretty_xml = "n".join(line for line in pretty_xml.split("n") if line.strip())

# Print the pretty XML
print(pretty_xml)

# Example usage
xml_string = '''

Text

'''

pretty_print_xml_minidom(xml_string)

登录后复制

输出

Text

登录后复制

程序2:使用xml.etree.ElementTree

import xml.etree.ElementTree as ET

def indent(elem, level=0):
# Add indentation
indent_size = " "
i = "n" + level * indent_size
if len(elem):
if not elem.text or not elem.text.strip():
elem.text = i + indent_size
if not elem.tail or not elem.tail.strip():
elem.tail = i
for elem in elem:
indent(elem, level + 1)
if not elem.tail or not elem.tail.strip():
elem.tail = i
else:
if level and (not elem.tail or not elem.tail.strip()):
elem.tail = i

def pretty_print_xml_elementtree(xml_string):
# Parse the XML string
root = ET.fromstring(xml_string)

# Indent the XML
indent(root)

# Convert the XML element back to a string
pretty_xml = ET.tostring(root, encoding="unicode")

# Print the pretty XML
print(pretty_xml)

# Example usage
xml_string = '''

Text

'''

pretty_print_xml_elementtree(xml_string)

登录后复制

输出

Text

登录后复制

结论

总而言之,在 Python 中漂亮地打印 XML 对于提高 XML 数据的可读性和结构至关重要。无论是使用 xml.dom.minidom 还是 xml.etree.ElementTree 库,开发人员都可以轻松地使用适当的缩进来格式化 XML。通过采用这些技术,程序员在 Python 项目中处理 XML 数据时可以增强代码理解、简化调试并促进更好的协作。

以上就是在Python中漂亮地打印XML的详细内容,更多请关注每日运维网(www.mryunwei.com)其它相关文章!

相关文章

JavaScript2024新功能:Object.groupBy、正则表达式v标志
PHP trim 函数对多字节字符的使用和限制
新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
为React 19做准备:WordPress 6.6用户指南
如何删除WordPress中的所有评论

发布评论