电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

python實現selenium網絡爬蟲的方法小結

瀏覽:32日期:2022-06-25 11:59:32

selenium最初是一個自動化測試工具,而爬蟲中使用它主要是為了解決requests無法直接執行JavaScript代碼的問題,selenium本質是通過驅動瀏覽器,完全模擬瀏覽器的操作,比如跳轉、輸入、點擊、下拉等,來拿到網頁渲染之后的結果,可支持多種瀏覽器,這里只用到谷歌瀏覽器。

1.selenium初始化方法一:會打開網頁

# 該方法會打開goole網頁from selenium import webdriverurl = ’網址’driver = webdriver.Chrome()driver.get(url)driver.maximize_window() # 實現窗口最大化方法二:不會打開網頁

# 該方法會隱式打開goole網頁from selenium import webdriverurl = ’網址’driver = webdriver.ChromeOptions()driver.add_argument('headless')driver = webdriver.Chrome(options=driver)driver.get(url)

driver = webdriver.Chrome()出錯是因為沒有chromedriver.exe這個文件

2.元素定位

在selenium中,可以有多種方法對元素進行定位,個人通常喜歡用Xpath和selector來定位元素,這樣就不用一個一個的去找節點,直接在網頁上定位到元素復制就行。

driver.find_element_by_id() # 通過元素ID定位driver.find_element_by_name() # 通過元素Name定位driver.find_element_by_class_name() # 通過類名定位driver.find_element_by_tag_name() # 通過元素TagName定位driver.find_element_by_link_text() # 通過文本內容定位driver.find_element_by_partial_link_text()driver.find_element_by_xpath() # 通過Xpath語法定位driver.find_element_by_css_selector() # 通過選擇器定位

注:若尋找多個元素,要記得用復數來選擇(element改為elements)

# 例如[i.text for i in driver.find_elements_by_xpath()]

python實現selenium網絡爬蟲的方法小結

3.建立點擊事件

因為有些網站的需求,需建立點擊事件,如下圖的這種時間選擇,需要設置點擊和輸入內容,設置的方法也很簡單。

python實現selenium網絡爬蟲的方法小結

driver.find_element_by_css_selector(’’).click() # 點擊driver.find_element_by_css_selector(’’).send_keys(’2021-3-9’) # 輸入內容

4.切換窗口

有些網站點擊之后會產生新窗口,這時就需要進行窗口的切換才能進行元素定位

win = driver.window_handles # 獲取當前瀏覽器的所有窗口driver.switch_to.window(win[-1]) # 切換到最后打開的窗口driver.close() # 關閉當前窗口driver.switch_to.window(win[0]) # 切換到最初的窗口

5.iframe問題

有些網站會采用iframe來編寫頁面,這時就需要進入到iframe才可以獲取元素,一般有多少個iframe就需要進入多少個iframe。

python實現selenium網絡爬蟲的方法小結

# 有兩個iframe,需逐步進入iframe1 = driver.find_element_by_xpath(’’)driver.switch_to.frame(iframe1)iframe2 = driver.find_element_by_xpath(’’)driver.switch_to.frame(iframe2)

到此這篇關于python實現selenium網絡爬蟲的文章就介紹到這了,更多相關python selenium網絡爬蟲內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 实验室pH计|电导率仪|溶解氧测定仪|离子浓度计|多参数水质分析仪|pH电极-上海般特仪器有限公司 | 蜘蛛车-高空作业平台-升降机-高空作业车租赁-臂式伸缩臂叉装车-登高车出租厂家 - 普雷斯特机械设备(北京)有限公司 | 焊管生产线_焊管机组_轧辊模具_焊管设备_焊管设备厂家_石家庄翔昱机械 | 通风气楼_通风天窗_屋顶风机-山东美创通风设备有限公司 | 裹包机|裹膜机|缠膜机|绕膜机-上海晏陵智能设备有限公司 | 塑木弯曲试验机_铜带拉伸强度试验机_拉压力测试台-倾技百科 | 减速机_上海宜嘉减速机| 广州番禺搬家公司_天河黄埔搬家公司_企业工厂搬迁_日式搬家_广州搬家公司_厚道搬迁搬家公司 | 莱州网络公司|莱州网站建设|莱州网站优化|莱州阿里巴巴-莱州唯佳网络科技有限公司 | 粘度计维修,在线粘度计,二手博勒飞粘度计维修|收购-天津市祥睿科技有限公司 | 培训中心-海南香蕉蛋糕加盟店技术翰香原中心官网总部 | 圈酒招商网【jiushuitv.com】_酒水招商_代理_加盟平台 | 精密机械零件加工_CNC加工_精密加工_数控车床加工_精密机械加工_机械零部件加工厂 | 植筋胶-粘钢胶-碳纤维布-碳纤维板-环氧砂浆-加固材料生产厂家-上海巧力建筑科技有限公司 | 实验室装修_实验室设计_实验室规划设计- 上海广建净化工程公司 | 成都租车_成都租车公司_成都租车网_众行宝| b2b网站大全,b2b网站排名,找b2b网站就上地球网 | PC构件-PC预制构件-构件设计-建筑预制构件-PC构件厂-锦萧新材料科技(浙江)股份有限公司 | 齿式联轴器-弹性联轴器-联轴器厂家-江苏诺兴传动联轴器制造有限公司 | 工业胀紧套_万向节联轴器_链条-规格齐全-型号选购-非标订做-厂家批发价格-上海乙谛精密机械有限公司 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | 空冷器|空气冷却器|空水冷却器-无锡赛迪森机械有限公司[官网] | 辽宁资质代办_辽宁建筑资质办理_辽宁建筑资质延期升级_辽宁中杭资质代办 | 扬尘在线监测系统_工地噪声扬尘检测仪_扬尘监测系统_贝塔射线扬尘监测设备「风途物联网科技」 | 整车VOC采样环境舱-甲醛VOC预处理舱-多舱法VOC检测环境仓-上海科绿特科技仪器有限公司 | 自动螺旋上料机厂家价格-斗式提升机定制-螺杆绞龙输送机-杰凯上料机 | 上海办公室装修公司_办公室设计_直营办公装修-羚志悦装 | 培训中心-翰香原香酥板栗饼加盟店总部-正宗板栗酥饼技术 | 油冷式_微型_TDY电动滚筒_外装_外置式电动滚筒厂家-淄博秉泓机械有限公司 | 共享雨伞_共享童车_共享轮椅_共享陪护床-共享产品的领先者_有伞科技 | 云南成人高考网| 深圳市八百通智能技术有限公司官方网站 | 谷歌关键词优化-外贸网站优化-Google SEO小语种推广-思亿欧外贸快车 | 北京网站建设首页,做网站选【优站网】,专注北京网站建设,北京网站推广,天津网站建设,天津网站推广,小程序,手机APP的开发。 | 胶原检测试剂盒,弹性蛋白检测试剂盒,类克ELISA试剂盒,阿达木单抗ELISA试剂盒-北京群晓科苑生物技术有限公司 | 快速卷帘门_硬质快速卷帘门-西朗门业 | 车辆定位管理系统_汽车GPS系统_车载北斗系统 - 朗致物联 | 厂厂乐-汇聚海量采购信息的B2B微营销平台-厂厂乐官网 | 北京征地律师,征地拆迁律师,专业拆迁律师,北京拆迁律师,征地纠纷律师,征地诉讼律师,征地拆迁补偿,拆迁律师 - 北京凯诺律师事务所 | 奥因-光触媒除甲醛公司-除甲醛加盟公司十大品牌 | 武汉森源蓝天环境科技工程有限公司-为环境污染治理提供协同解决方案 |