如何使用lxml处理XML文档中的CDATA部分
要在lxml中处理XML文档中的CDATA部分,可以使用CDATA
类和fromstring()
函数来解析XML文档。
下面是一个示例代码,演示如何在lxml中处理XML文档中的CDATA部分:
from lxml import etree# XML文档包含CDATA部分xml_data = '''<root><data><![CDATA[This is a CDATA section]]></data></root>'''# 解析XML文档root = etree.fromstring(xml_data)# 获取CDATA部分的内容cdata = root.find('data').text# 打印CDATA部分内容print(cdata)
在这个示例中,首先定义了一个包含CDATA部分的XML文档字符串xml_data
。然后使用fromstring()
函数将其解析为一个Element对象root
。接着使用find()
方法找到包含CDATA部分的元素,并通过text
属性获取其中的内容。最后打印出CDATA部分的内容。