电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Python 通過爬蟲實現GitHub網頁的模擬登錄的示例代碼

瀏覽:40日期:2022-07-13 18:10:38

1. 實例描述

通過爬蟲獲取網頁的信息時,有時需要登錄網頁后才可以獲取網頁中的可用數據,例如獲取 GitHub 網頁中的注冊號碼時,就需要先登錄賬號才能在登錄后的頁面中看到該信息,如下圖所示。那么該如何實現模擬登錄的功能呢?本文實現將通過爬蟲實現 GitHub 網頁的模擬登錄。

Python 通過爬蟲實現GitHub網頁的模擬登錄的示例代碼

2. 代碼實現

在實現 GitHub 網頁的模擬登錄時,首先需要查看提交登錄請求時都要哪些請求參數,然后獲取登錄請求的所有參數,再發送登錄請求。如果登錄成功的情況下獲取頁面中的注冊號碼信息即可。具體步驟如下:

(1) 點擊 此處 打開 GitHub 的登錄頁面,然后輸入賬號與密碼,如下圖所示。

Python 通過爬蟲實現GitHub網頁的模擬登錄的示例代碼

(2) 用 F12 或者 鼠標右鍵單擊網頁選擇 檢查 打開瀏覽器的開發者工具,選擇獲取網絡請求過程,然后單擊登錄頁面中的 Sign in 按鈕,此時開發者工具中將顯示 GitHub 網頁的登錄請求過程,重點查找名稱為 session 的網絡請求。如下圖所示。

Python 通過爬蟲實現GitHub網頁的模擬登錄的示例代碼

(3) 單擊名稱為 session 的網絡請求,然后在 Headers 請求信息中主要查看 Request Headers與 Form Data 中的各種信息,其中紅框內為重要參數與數據。如下圖所示。

Python 通過爬蟲實現GitHub網頁的模擬登錄的示例代碼

說明:Host 為主頁面地址,Referer 為當前請求的來源地址。User-Agent 為瀏覽器的頭部信息。Form Data 中的所有信息都是登錄請求的所用參數,其中動態參數為重要參數,authenticity_token 為加密字符串,login 為登錄的賬號,password 為密碼,其它參數為靜態參數。由于動態參數只有 authenticity_token、login 以及password ,而用戶名與密碼只需要將動態字符串填寫對應的位置即可,所以接下來需要獲取 authenticity_token 參數所對應的加密字符串。

(4) 在瀏覽器中退出所登錄的 GitHub 賬號,返回 GitHub 的登錄頁面,打開瀏覽器開發者工具,查看網頁的 html 代碼,然后在代碼中搜索 authenticity_token 關鍵詞,標簽內 value 所對應的值為 authenticity_token 參數的加密字符串。如下圖所示。

Python 通過爬蟲實現GitHub網頁的模擬登錄的示例代碼

(5) 實現爬蟲代碼,首先導入所需模塊,然后創建頭部信息,再通過 Session 會話對象發送網絡請求獲取 authenticity_token 信息,最后通過所有的登陸請求參數實現 GitHub 網頁的登陸請求并提取注冊號碼。具體代碼如下:

# -*- coding: utf-8 -*-# @Time : 2020/5/10 23:25# @Author : 我就是任性-Amo# @FileName: 77.通過爬蟲實現GitHub網頁的模擬登錄.py# @Software: PyCharm# @Blog :https://blog.csdn.net/xw1680import requests # 導入網絡請求模塊from lxml import etree # 導入數據解析模塊 都是第三方模塊需要安裝 # pip install requests/lxml如果太慢 可以加上鏡像服務器 或者在Pycharm中使用圖形化界面進行安裝class GitHubLogin(object): def __init__(self, username, password): # 構造頭部信息 self.headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) ' 'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36', 'Host': 'github.com', 'Referer': 'https://github.com/login' } self.login_url = 'https://github.com/login' # 登錄頁面地址 self.post_url = 'https://github.com/session' # 實現登錄的請求地址 self.session = requests.Session() # 創建Session會話對象 self.user_name = username # 用戶名 self.password = password # 密碼 # 獲取authenticity_token信息 def get_token(self): # 發送登錄頁面的網絡請求 response = self.session.get(self.login_url, headers=self.headers) if response.status_code == 200: # 判斷請求是否成功 html = etree.HTML(response.text) # 解析html # 提取authenticity_token信息 token = html.xpath('//div[@id=’login’]/form/input[1]/@value')[0] # print(token) 測試是否能夠獲取到token return token # 返回信息 # 實現登錄 def login(self): # 請求參數 post_data = { 'commit': 'Sign in', 'authenticity_token': self.get_token(), 'login': self.user_name, 'password': self.password, 'webauthn - support': 'supported' } # 發送登錄請求 response = self.session.post(self.post_url, headers=self.headers, data=post_data) if response.status_code == 200: # 判斷請求是否成功 html = etree.HTML(response.text) # 解析html # 獲取注冊號碼 register_number = html.xpath('//div[contains(@class,’Header-item’)][last()]//strong')[0] print(f'注冊號碼為: {register_number.text}') else: print('登錄失敗')if __name__ == ’__main__’: user_name = input('請輸入您的用戶名:') # 獲取輸入的用戶名 password = input('請輸入您的密碼:') # 獲取輸入的密碼 login = GitHubLogin(user_name, password) # 創建登錄類對象并傳遞輸入的用戶名與密碼 login.login()

執行以上代碼,輸入用戶名與密碼,即可顯示獲取的注冊號碼。如下圖所示:

Python 通過爬蟲實現GitHub網頁的模擬登錄的示例代碼

到此這篇關于Python 通過爬蟲實現GitHub網頁的模擬登錄的示例代碼的文章就介紹到這了,更多相關Python GitHub模擬登錄內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 耐高温硅酸铝板-硅酸铝棉保温施工|亿欧建设工程 | 沟盖板_复合沟盖板厂_电力盖板_树脂雨水篦子-淄博拜斯特 | 广州办公室设计,办公室装修,写字楼设计,办公室装修公司_德科 | 沧州友城管业有限公司-内外涂塑钢管-大口径螺旋钢管-涂塑螺旋管-保温钢管生产厂家 | 昆明挖掘机修理厂_挖掘机翻新再制造-昆明聚力工程机械维修有限公司 | 济南ISO9000认证咨询代理公司,ISO9001认证,CMA实验室认证,ISO/TS16949认证,服务体系认证,资产管理体系认证,SC食品生产许可证- 济南创远企业管理咨询有限公司 郑州电线电缆厂家-防火|低压|低烟无卤电缆-河南明星电缆 | 集菌仪_智能集菌仪_全封闭集菌仪_无菌检查集菌仪厂家-那艾 | 半自动预灌装机,卡式瓶灌装机,注射器灌装机,给药器灌装机,大输液灌装机,西林瓶灌装机-长沙一星制药机械有限公司 | 大型冰雕-景区冰雕展制作公司,3D创意设计源头厂家-[赛北冰雕] | 工业插头-工业插头插座【厂家】-温州罗曼电气 | 电渗析,废酸回收,双极膜-山东天维膜技术有限公司 | 防水套管-柔性防水套管-刚性防水套管-上海执品管件有限公司 | 微型实验室真空泵-无油干式真空泵-微型涡旋耐腐蚀压缩机-思科涡旋科技(杭州)有限公司 | 北京易通慧公司从事北京网站优化,北京网络推广、网站建设一站式服务商-北京网站优化公司 | Win10系统下载_32位/64位系统/专业版/纯净版下载 | 高低温试验房-深圳高低温湿热箱-小型高低温冲击试验箱-爱佩试验设备 | 杰福伦_磁致伸缩位移传感器_线性位移传感器-意大利GEFRAN杰福伦-河南赉威液压科技有限公司 | ★店家乐|服装销售管理软件|服装店收银系统|内衣店鞋店进销存软件|连锁店管理软件|收银软件手机版|会员管理系统-手机版,云版,App | 北京开源多邦科技发展有限公司官网 | PVC快速门-硬质快速门-洁净室快速门品牌厂家-苏州西朗门业 | 空调风机,低噪声离心式通风机,不锈钢防爆风机,前倾皮带传动风机,后倾空调风机-山东捷风风机有限公司 | 电销卡 防封电销卡 不封号电销卡 电话销售卡 白名单电销卡 电销系统 外呼系统 | 厦门网站建设_厦门网站设计_小程序开发_网站制作公司【麦格科技】 | 东莞画册设计_logo/vi设计_品牌包装设计 - 华略品牌设计公司 | 十字轴_十字轴万向节_十字轴总成-南京万传机械有限公司 | 二手回收公司_销毁处理公司_设备回收公司-找回收信息网 | 定坤静电科技静电消除器厂家-除静电设备 | 电镀标牌_电铸标牌_金属标贴_不锈钢标牌厂家_深圳市宝利丰精密科技有限公司 | 对照品_中药对照品_标准品_对照药材_「格利普」高纯中药标准品厂家-成都格利普生物科技有限公司 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库 | 企典软件一站式企业管理平台,可私有、本地化部署!在线CRM客户关系管理系统|移动办公OA管理系统|HR人事管理系统|人力 | 2025第九届世界无人机大会| 潍坊大集网-潍坊信息港-潍坊信息网 | 交通信号灯生产厂家_红绿灯厂家_电子警察监控杆_标志杆厂家-沃霖电子科技 | 德国GMN轴承,GMN角接触球轴承,GMN单向轴承,GMN油封,GMN非接触式密封 | 样品瓶(色谱样品瓶)百科-浙江哈迈科技有限公司| 有源电力滤波装置-电力有源滤波器-低压穿排电流互感器|安科瑞 | 工业胀紧套_万向节联轴器_链条-规格齐全-型号选购-非标订做-厂家批发价格-上海乙谛精密机械有限公司 | 电动卫生级调节阀,电动防爆球阀,电动软密封蝶阀,气动高压球阀,气动对夹蝶阀,气动V型调节球阀-上海川沪阀门有限公司 | 防腐木批发价格_深圳_惠州_东莞防腐木厂家_森源(深圳)防腐木有限公司 | _网名词典_网名大全_qq网名_情侣网名_个性网名 | 色谱柱-淋洗液罐-巴罗克试剂槽-巴氏吸管-5ml样品瓶-SBS液氮冻存管-上海希言科学仪器有限公司 |