电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Python利用命名空間解析XML文檔

瀏覽:8日期:2022-07-14 15:45:01

問題

你想解析某個XML文檔,文檔中使用了XML命名空間。

解決方案

考慮下面這個使用了命名空間的文檔:

<?xml version='1.0' encoding='utf-8'?><top> <author>David Beazley</author> <content> <html xmlns='http://www.w3.org/1999/xhtml'> <head><title>Hello World</title> </head> <body><h1>Hello World!</h1> </body> </html> </content></top>

如果你解析這個文檔并執行普通的查詢,你會發現這個并不是那么容易,因為所有步驟都變得相當的繁瑣。

>>> # Some queries that work>>> doc.findtext(’author’)’David Beazley’>>> doc.find(’content’)<Element ’content’ at 0x100776ec0>>>> # A query involving a namespace (doesn’t work)>>> doc.find(’content/html’)>>> # Works if fully qualified>>> doc.find(’content/{http://www.w3.org/1999/xhtml}html’)<Element ’{http://www.w3.org/1999/xhtml}html’ at 0x1007767e0>>>> # Doesn’t work>>> doc.findtext(’content/{http://www.w3.org/1999/xhtml}html/head/title’)>>> # Fully qualified>>> doc.findtext(’content/{http://www.w3.org/1999/xhtml}html/’... ’{http://www.w3.org/1999/xhtml}head/{http://www.w3.org/1999/xhtml}title’)’Hello World’>>>

你可以通過將命名空間處理邏輯包裝為一個工具類來簡化這個過程:

class XMLNamespaces: def __init__(self, **kwargs): self.namespaces = {} for name, uri in kwargs.items(): self.register(name, uri) def register(self, name, uri): self.namespaces[name] = ’{’+uri+’}’ def __call__(self, path): return path.format_map(self.namespaces)

通過下面的方式使用這個類:

>>> ns = XMLNamespaces(html=’http://www.w3.org/1999/xhtml’)>>> doc.find(ns(’content/{html}html’))<Element ’{http://www.w3.org/1999/xhtml}html’ at 0x1007767e0>>>> doc.findtext(ns(’content/{html}html/{html}head/{html}title’))’Hello World’>>>

討論

解析含有命名空間的XML文檔會比較繁瑣。 上面的 XMLNamespaces 僅僅是允許你使用縮略名代替完整的URI將其變得稍微簡潔一點。

很不幸的是,在基本的 ElementTree 解析中沒有任何途徑獲取命名空間的信息。 但是,如果你使用 iterparse() 函數的話就可以獲取更多關于命名空間處理范圍的信息。例如:

>>> from xml.etree.ElementTree import iterparse>>> for evt, elem in iterparse(’ns2.xml’, (’end’, ’start-ns’, ’end-ns’)):... print(evt, elem)...end <Element ’author’ at 0x10110de10>start-ns (’’, ’http://www.w3.org/1999/xhtml’)end <Element ’{http://www.w3.org/1999/xhtml}title’ at 0x1011131b0>end <Element ’{http://www.w3.org/1999/xhtml}head’ at 0x1011130a8>end <Element ’{http://www.w3.org/1999/xhtml}h1’ at 0x101113310>end <Element ’{http://www.w3.org/1999/xhtml}body’ at 0x101113260>end <Element ’{http://www.w3.org/1999/xhtml}html’ at 0x10110df70>end-ns Noneend <Element ’content’ at 0x10110de68>end <Element ’top’ at 0x10110dd60>>>> elem # This is the topmost element<Element ’top’ at 0x10110dd60>>>>

最后一點,如果你要處理的XML文本除了要使用到其他高級XML特性外,還要使用到命名空間, 建議你最好是使用 lxml 函數庫來代替 ElementTree 。 例如,lxml 對利用DTD驗證文檔、更好的XPath支持和一些其他高級XML特性等都提供了更好的支持。 這一小節其實只是教你如何讓XML解析稍微簡單一點。

以上就是Python利用命名空間解析XML文檔的詳細內容,更多關于Python命名空間解析XML文檔的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: PO膜_灌浆膜及地膜供应厂家 - 青州市鲁谊塑料厂| 播音主持培训-中影人教育播音主持学苑「官网」-中国艺考界的贵族学校 | 悬浮拼装地板_篮球场木地板翻新_运动木地板价格-上海越禾运动地板厂家 | 气动隔膜阀_气动隔膜阀厂家_卫生级隔膜阀价格_浙江浙控阀门有限公司 | 蓝牙音频分析仪-多功能-四通道-八通道音频分析仪-东莞市奥普新音频技术有限公司 | 葡萄酒灌装机-食用油灌装机-液体肥灌装设备厂家_青州惠联灌装机械 | 昊宇水工|河北昊宇水工机械工程有限公司 | 变色龙PPT-国内原创PPT模板交易平台 - PPT贰零 - 西安聚讯网络科技有限公司 | 「银杏树」银杏树行情价格_银杏树种植_山东程锦园林 | 垃圾清运公司_环卫保洁公司_市政道路保洁公司-华富环境 | 高效复合碳源-多核碳源生产厂家-污水处理反硝化菌种一长隆科技库巴鲁 | 烟台游艇培训,威海游艇培训-烟台市邮轮游艇行业协会 | 中天寰创-内蒙古钢结构厂家|门式刚架|钢结构桁架|钢结构框架|包头钢结构煤棚 | H型钢切割机,相贯线切割机,数控钻床,数控平面钻,钢结构设备,槽钢切割机,角钢切割机,翻转机,拼焊矫一体机 | 保定市泰宏机械制造厂-河北铸件厂-铸造厂-铸件加工-河北大件加工 | 定时排水阀/排气阀-仪表三通旋塞阀-直角式脉冲电磁阀-永嘉良科阀门有限公司 | 冰雕-冰雪世界-大型冰雕展制作公司-赛北冰雕官网 | 雪花制冰机(实验室雪花制冰机)百科 | 洛阳网站建设_洛阳网站优化_网站建设平台_洛阳香河网络科技有限公司 | 电池高低温试验箱-气态冲击箱-双层电池防爆箱|简户百科 | 变位机,焊接变位机,焊接变位器,小型变位机,小型焊接变位机-济南上弘机电设备有限公司 | 3d打印服务,3d打印汽车,三维扫描,硅胶复模,手板,快速模具,深圳市精速三维打印科技有限公司 | 电地暖-电采暖-发热膜-石墨烯电热膜品牌加盟-暖季地暖厂家 | 干洗店加盟_洗衣店加盟_干洗店设备-伊蔻干洗「武汉总部」 | 快干水泥|桥梁伸缩缝止水胶|伸缩缝装置生产厂家-广东广航交通科技有限公司 | 防水套管|柔性防水套管|伸缩器|伸缩接头|传力接头-河南伟创管道 防水套管_柔性防水套管_刚性防水套管-巩义市润达管道设备制造有限公司 | 北京易通慧公司从事北京网站优化,北京网络推广、网站建设一站式服务商-北京网站优化公司 | 传爱自考网_传爱自学考试网| 炭黑吸油计_测试仪,单颗粒子硬度仪_ASTM标准炭黑自销-上海贺纳斯仪器仪表有限公司(HITEC中国办事处) | 拉力测试机|材料拉伸试验机|电子拉力机价格|万能试验机厂家|苏州皖仪实验仪器有限公司 | 低噪声电流前置放大器-SR570电流前置放大器-深圳市嘉士达精密仪器有限公司 | 千斤顶,液压千斤顶-力良企业,专业的液压千斤顶制造商,shliliang.com | 悬浮拼装地板_幼儿园_篮球场_悬浮拼接地板-山东悬浮拼装地板厂家 | 产业规划_产业园区规划-产业投资选址及规划招商托管一体化服务商-中机院产业园区规划网 | 进口试验机价格-进口生物材料试验机-西安卡夫曼测控技术有限公司 | 钢格栅板_钢格板网_格栅板-做专业的热镀锌钢格栅板厂家-安平县迎瑞丝网制造有限公司 | 上海三信|ph计|酸度计|电导率仪-艾科仪器 | 永嘉县奥阳陶瓷阀门有限公司| 智慧水务|智慧供排水利信息化|水厂软硬件系统-上海敢创 | 环比机械| CTAB,表面活性剂1631溴型(十六烷基三甲基溴化铵)-上海升纬化工原料有限公司 |