电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python使用XPath解析數(shù)據(jù)爬取起點(diǎn)小說(shuō)網(wǎng)數(shù)據(jù)

瀏覽:4日期:2022-06-21 15:45:48
1. xpath 的介紹

xpath是一門在XML文檔中查找信息的語(yǔ)言

優(yōu)點(diǎn): 可以在xml中找信息 支持HTML的查找 可以通過(guò)元素和屬性進(jìn)行導(dǎo)航

但是Xpath需要依賴xml的庫(kù),所以我們需要去安裝lxml的庫(kù)。

安裝lxml庫(kù)

我們先要安裝lxml的庫(kù),直接在pycharm里安裝即可:

python使用XPath解析數(shù)據(jù)爬取起點(diǎn)小說(shuō)網(wǎng)數(shù)據(jù)

XML的樹(shù)形結(jié)構(gòu):

python使用XPath解析數(shù)據(jù)爬取起點(diǎn)小說(shuō)網(wǎng)數(shù)據(jù)

元素-元素-屬性-文本

使用XPath選取節(jié)點(diǎn):

nodename: 選取此節(jié)點(diǎn)的所有節(jié)點(diǎn) /從根節(jié)點(diǎn)選擇 // 從匹配選擇的當(dāng)前節(jié)點(diǎn)選擇文檔中的節(jié)點(diǎn),而不考慮他們的位置 . 選擇當(dāng)前節(jié)點(diǎn) .. 選擇當(dāng)前節(jié)點(diǎn)的父節(jié)點(diǎn)(此處是兩個(gè)點(diǎn),瀏覽器默認(rèn)顯示3個(gè)..) /text() 獲取當(dāng)前路徑下的文本內(nèi)容 /@xxx 提取當(dāng)前路徑下標(biāo)簽的屬性值 選取節(jié)點(diǎn)的表達(dá)式舉例:

python使用XPath解析數(shù)據(jù)爬取起點(diǎn)小說(shuō)網(wǎng)數(shù)據(jù)

2. 爬取起點(diǎn)小說(shuō)網(wǎng)在瀏覽器中獲取書名和作者測(cè)試

在谷歌里安裝一個(gè)xpath的插件

python使用XPath解析數(shù)據(jù)爬取起點(diǎn)小說(shuō)網(wǎng)數(shù)據(jù)

在html中查找book-mid-info

python使用XPath解析數(shù)據(jù)爬取起點(diǎn)小說(shuō)網(wǎng)數(shù)據(jù)

我們要獲取小說(shuō)的名稱: 也就是 //div[@class=’book-mid-info’]/h4/a/txt()

python使用XPath解析數(shù)據(jù)爬取起點(diǎn)小說(shuō)網(wǎng)數(shù)據(jù)

再加一個(gè)獲取作者:

python使用XPath解析數(shù)據(jù)爬取起點(diǎn)小說(shuō)網(wǎng)數(shù)據(jù)

使用xpath獲取起點(diǎn)小說(shuō)網(wǎng)的數(shù)據(jù)

# 作者:互聯(lián)網(wǎng)老辛# 開(kāi)發(fā)時(shí)間:2021/4/8/0008 8:24import requestsfrom lxml import etreeurl='https://www.qidian.com/rank/yuepiao'headers={’user-agent’:’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400’}#發(fā)送請(qǐng)求resp=requests.get(url,headers)e=etree.HTML(resp.text) #類型轉(zhuǎn)換,把str轉(zhuǎn)變?yōu)閏lass ’lxml.etree._ELementprint(type(e))names=e.xpath(’//div[@class='book-mid-info']/h4/a/text()’)authors=e.xpath(’//p[@class='author']/a[1]/text()’)print(names)print(authors)#名稱和作者對(duì)應(yīng)for name,authors in zip(names,authors): print(name,':',authors)

以上就是python使用XPath解析數(shù)據(jù)爬取起點(diǎn)小說(shuō)網(wǎng)數(shù)據(jù)的詳細(xì)內(nèi)容,更多關(guān)于python XPath解析數(shù)據(jù)爬取起點(diǎn)小說(shuō)網(wǎng)的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: RTO换向阀_VOC高温阀门_加热炉切断阀_双偏心软密封蝶阀_煤气蝶阀_提升阀-湖北霍科德阀门有限公司 | 苏州西装定制-西服定制厂家-职业装定制厂家-尺品服饰西装定做公司 | 口信网(kousing.com) - 行业资讯_行业展会_行业培训_行业资料 | 臭氧老化试验箱,高低温试验箱,恒温恒湿试验箱,防水试验设备-苏州亚诺天下仪器有限公司 | 自动焊锡机_点胶机_螺丝机-锐驰机器人 | 深圳湾1号房价_深圳湾1号二手房源| 紫外线老化试验箱_uv紫外线老化试验箱价格|型号|厂家-正航仪器设备 | 能量回馈_制动单元_电梯节能_能耗制动_深圳市合兴加能科技有限公司 | 玻纤土工格栅_钢塑格栅_PP焊接_单双向塑料土工格栅_复合防裂布厂家_山东大庚工程材料科技有限公司 | 桌上式超净工作台-水平送风超净工作台-上海康路仪器设备有限公司 | 517瓜水果特产网|一个专注特产好物的网站| 体检车_移动CT车_CT检查车_CT车_深圳市艾克瑞电气有限公司移动CT体检车厂家-深圳市艾克瑞电气有限公司 | 珠海冷却塔降噪维修_冷却塔改造报价_凉水塔风机维修厂家- 广东康明节能空调有限公司 | 根系分析仪,大米外观品质检测仪,考种仪,藻类鉴定计数仪,叶面积仪,菌落计数仪,抑菌圈测量仪,抗生素效价测定仪,植物表型仪,冠层分析仪-杭州万深检测仪器网 | 房车价格_依维柯/大通/东风御风/福特全顺/江铃图片_云梯搬家车厂家-程力专用汽车股份有限公司 | 机械立体车库租赁_立体停车设备出租_智能停车场厂家_春华起重 | 工业rfid读写器_RFID工业读写器_工业rfid设备厂商-ANDEAWELL | 制冷采购电子商务平台——制冷大市场 | 酒精检测棒,数显温湿度计,酒安酒精测试仪,酒精检测仪,呼气式酒精检测仪-郑州欧诺仪器有限公司 | 滁州高低温冲击试验箱厂家_安徽高低温试验箱价格|安徽希尔伯特 | 北京森语科技有限公司-模型制作专家-展览展示-沙盘模型设计制作-多媒体模型软硬件开发-三维地理信息交互沙盘 | 科客,主见不成见| 九爱图纸|机械CAD图纸下载交流中心| 科研ELISA试剂盒,酶联免疫检测试剂盒,昆虫_植物ELISA酶免试剂盒-上海仁捷生物科技有限公司 | 【同风运车官网】一站式汽车托运服务平台,验车满意再付款 | 气动调节阀,电动调节阀,自力式压力调节阀,切断阀「厂家」-浙江利沃夫自控阀门 | 洗瓶机厂家-酒瓶玻璃瓶冲瓶机-瓶子烘干机-封口旋盖压盖打塞机_青州惠联灌装机械 | 防潮防水通风密闭门源头实力厂家 - 北京酷思帝克门窗 | 物联网卡_物联网卡购买平台_移动物联网卡办理_移动联通电信流量卡通信模组采购平台? | 曙光腾达官网-天津脚手架租赁-木板架出租-移动门式脚手架租赁「免费搭设」 | 上海质量认证办理中心| 密集柜_档案密集柜_智能密集架_密集柜厂家_密集架价格-智英伟业 密集架-密集柜厂家-智能档案密集架-自动选层柜订做-河北风顺金属制品有限公司 | 压力控制器,差压控制器,温度控制器,防爆压力控制器,防爆温度控制器,防爆差压控制器-常州天利智能控制股份有限公司 | 螺杆式冷水机-低温冷水机厂家-冷冻机-风冷式-水冷式冷水机-上海祝松机械有限公司 | 不发火防静电金属骨料_无机磨石_水泥自流平_修补砂浆厂家「圣威特」 | 天一线缆邯郸有限公司_煤矿用电缆厂家_矿用光缆厂家_矿用控制电缆_矿用通信电缆-天一线缆邯郸有限公司 | 除湿机|工业除湿机|抽湿器|大型地下室车间仓库吊顶防爆除湿机|抽湿烘干房|新风除湿机|调温/降温除湿机|恒温恒湿机|加湿机-杭州川田电器有限公司 | 细沙回收机-尾矿干排脱水筛设备-泥石分离机-建筑垃圾分拣机厂家-青州冠诚重工机械有限公司 | 控显科技 - 工控一体机、工业显示器、工业平板电脑源头厂家 | 奥运星-汽车性能网评-提供个性化汽车资讯 | 3dmax渲染-效果图渲染-影视动画渲染-北京快渲科技有限公司 |