电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Python lxml庫的簡單介紹及基本使用講解

瀏覽:7日期:2022-07-01 14:43:44
1.lxml庫介紹

lxml是XML和HTML的解析器,其主要功能是解析和提取XML和HTML中的數據;lxml和正則一樣,也是用C語言實現的,是一款高性能的python HTML、XML解析器,也可以利用XPath語法,來定位特定的元素及節點信息

HTML是超文本標記語言,主要用于顯示數據,他的焦點是數據的外觀XML是可擴展標記語言,主要用于傳輸和存儲數據,他的焦點是數據的內容

2.安裝lxml方法

方法1:在cmd運行窗口中輸入:pip install lxml

Python lxml庫的簡單介紹及基本使用講解

方法2:在Pycharm中下載File?Setting?Project?Project Interpreter?點擊右上角的“+”—第1步

Python lxml庫的簡單介紹及基本使用講解

第2步

Python lxml庫的簡單介紹及基本使用講解

第3步

Python lxml庫的簡單介紹及基本使用講解

方法3:進入這個網站進行下載:https://lxml.de/index.html

Python lxml庫的簡單介紹及基本使用講解

3.基本使用

我們可以利用他解析HTML代碼,并且在解析HTML代碼的時候,如果HTML代碼不規范或者不完整,lxml解析器會自動修復或補全代碼,從而提高效率

實例1:解析HTML代碼塊

#提取html中的數據from lxml import etreetext = ’’’<html> <div class='clearfix'> <div class='nav_com'> <ul> <li class='active'><a href='http://www.hdgsjgj.cn/' rel='external nofollow' >推薦</a></li> <li class=''><a href='http://www.hdgsjgj.cn/nav/python' rel='external nofollow' >Python</a></li> <li class=''><a href='http://www.hdgsjgj.cn/nav/java' rel='external nofollow' >Java</a></li> <li class=''><a href='http://www.hdgsjgj.cn/nav/web' rel='external nofollow' >前端</a></li> <li class=''><a href='http://www.hdgsjgj.cn/nav/arch' rel='external nofollow' >架構</a></li> <li class=''><a href='http://www.hdgsjgj.cn/nav/db' rel='external nofollow' >數據庫</a></li> <li class=''><a href='http://www.hdgsjgj.cn/nav/5g' rel='external nofollow' >5G</a></li> <li class=''><a href='http://www.hdgsjgj.cn/nav/game' rel='external nofollow' >游戲開發</a></li> <li class=''><a href='http://www.hdgsjgj.cn/nav/mobile' rel='external nofollow' >移動開發</a></li> <li class=''><a href='http://www.hdgsjgj.cn/nav/ops' rel='external nofollow' >運維</a></li> </ul> </div> </div></html>></html>>’’’#將字符串解析為html文檔html = etree.HTML(text)#print(html)#將字符串序列化為htmlresult = etree.tostring(html).decode(’utf-8’)print(result)

實例2:讀取并解析html文件

#將html文件進行解析from lxml import etree#將html文件進行讀取html = etree.parse(’data.html’)#將html內容序列化result = etree.tostring(html).decode(’utf-8’)print(result)

到此這篇關于Python lxml庫的簡單介紹及基本使用講解的文章就介紹到這了,更多相關Python lxml庫使用內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 杭州画室_十大画室_白墙画室_杭州美术培训_国美附中培训_附中考前培训_升学率高的画室_美术中考集训美术高考集训基地 | 数码听觉统合训练系统-儿童感觉-早期言语评估与训练系统-北京鑫泰盛世科技发展有限公司 | 气体检测仪-氢气检测仪-可燃气体传感器-恶臭电子鼻-深国安电子 | 长沙广告公司_制作,长沙喷绘_发光字_招牌制作_长沙泓润广告官网 长城人品牌官网 | 辽宁资质代办_辽宁建筑资质办理_辽宁建筑资质延期升级_辽宁中杭资质代办 | 智能化的检漏仪_气密性测试仪_流量测试仪_流阻阻力测试仪_呼吸管快速检漏仪_连接器防水测试仪_车载镜头测试仪_奥图自动化科技 | 日本细胞免疫疗法_肿瘤免疫治疗_NK细胞疗法 - 免疫密码 | 无锡网站建设-做网站-建网站-网页设计制作-阿凡达建站公司 | 木材烘干机,木炭烘干机,纸管/佛香烘干设备-河南蓝天机械制造有限公司 | 鼓风干燥箱_真空烘箱_高温干燥箱_恒温培养箱-上海笃特科学仪器 | 云南外加剂,云南速凝剂,云南外加剂代加工-普洱澜湄新材料科技有限公司 | 定制异形重型钢格栅板/钢格板_定做踏步板/排水沟盖板_钢格栅板批发厂家-河北圣墨金属制品有限公司 | 上海律师事务所_上海刑事律师免费咨询平台-煊宏律师事务所 | 光栅尺厂家_数显表维修-苏州泽升精密机械 | hdpe土工膜-防渗膜-复合土工膜-长丝土工布价格-厂家直销「恒阳新材料」-山东恒阳新材料有限公司 ETFE膜结构_PTFE膜结构_空间钢结构_膜结构_张拉膜_浙江萬豪空间结构集团有限公司 | 喷码机,激光喷码打码机,鸡蛋打码机,手持打码机,自动喷码机,一物一码防伪溯源-恒欣瑞达有限公司 | 中控室大屏幕-上海亿基自动化控制系统工程有限公司 | 涡轮流量计_LWGY智能气体液体电池供电计量表-金湖凯铭仪表有限公司 | 土壤检测仪器_行星式球磨仪_土壤团粒分析仪厂家_山东莱恩德智能科技有限公司 | 聚丙烯酰胺_阴离子_阳离子「用量少」巩义亿腾厂家直销,售后无忧 聚合甘油__盐城市飞龙油脂有限公司 | 称重传感器,测力传感器,拉压力传感器,压力变送器,扭矩传感器,南京凯基特电气有限公司 | 热风机_工业热风机生产厂家上海冠顶公司提供专业热风机图片价格实惠 | 深圳办公室装修,办公楼/写字楼装修设计,一级资质 - ADD写艺 | 精密冲床,高速冲床等冲压设备生产商-常州晋志德压力机厂 | 工业机械三维动画制作 环保设备原理三维演示动画 自动化装配产线三维动画制作公司-南京燃动数字 聚合氯化铝_喷雾聚氯化铝_聚合氯化铝铁厂家_郑州亿升化工有限公司 | 电磁铁_小型推拉电磁铁_电磁阀厂家-深圳市宗泰电机有限公司 | 直流电能表-充电桩电能表-导轨式电能表-智能电能表-浙江科为电气有限公司 | 食品质构分析仪-氧化诱导分析仪-瞬态法导热系数仪|热冰百科 | 上海办公室装修,办公楼装修设计,办公空间设计,企业展厅设计_写艺装饰公司 | 物和码官网,物和码,免费一物一码数字化营销SaaS平台 | STRO|DTRO-STRO反渗透膜(科普)_碟滤 | 贴片电容代理-三星电容-村田电容-风华电容-国巨电容-深圳市昂洋科技有限公司 | LED投光灯-工矿灯-led路灯头-工业灯具 - 山东普瑞斯照明科技有限公司 | 青岛美佳乐清洁工程有限公司|青岛油烟管道清洗|酒店|企事业单位|学校工厂厨房|青岛油烟管道清洗 插针变压器-家用电器变压器-工业空调变压器-CD型电抗器-余姚市中驰电器有限公司 | 带锯机|木工带锯机圆木推台锯|跑车带锯机|河北茂业机械制造有限公司| | 潍坊青州古城旅游景点攻略_青州酒店美食推荐-青州旅游网 | 昆明网络公司|云南网络公司|昆明网站建设公司|昆明网页设计|云南网站制作|新媒体运营公司|APP开发|小程序研发|尽在昆明奥远科技有限公司 | 电线电缆厂家|沈阳电缆厂|电线厂|沈阳英联塑力线缆有限公司 | 西门子代理商_西门子变频器总代理-翰粤百科 | 手机存放柜,超市储物柜,电子储物柜,自动寄存柜,行李寄存柜,自动存包柜,条码存包柜-上海天琪实业有限公司 | 高尔夫球杆_高尔夫果岭_高尔夫用品-深圳市新高品体育用品有限公司 |