电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

python 爬蟲請求模塊requests詳解

瀏覽:39日期:2022-07-03 11:36:53
requests

相比urllib,第三方庫requests更加簡單人性化,是爬蟲工作中常用的庫

requests安裝

初級爬蟲的開始主要是使用requests模塊安裝requests模塊:Windows系統:cmd中:

pip install requests

mac系統中:終端中:

pip3 install requestsrequests庫的基本使用

import requestsurl = ’https://www.csdn.net/’reponse = requests.get(url)#返回unicode格式的數據(str) print(reponse.text)

python 爬蟲請求模塊requests詳解

響應對象response的⽅法

response.text 返回unicode格式的數據(str)response.content 返回字節流數據(⼆進制)response.content.decode(‘utf-8’) ⼿動進⾏解碼response.url 返回urlresponse.encode() = ‘編碼’

狀態碼

response.status_code: 檢查響應的狀態碼

python 爬蟲請求模塊requests詳解

例如:200 : 請求成功301 : 永久重定向302 : 臨時重定向403 : 服務器拒絕請求404 : 請求失敗(服務器⽆法根據客戶端的請求找到資源(⽹⻚))500 : 服務器內部請求

# 導入requestsimport requests# 調用requests中的get()方法來向服務器發送請求,括號內的url參數就是我們# 需要訪問的網址,然后將獲取到的響應通過變量response保存起來url = ’https://www.csdn.net/’ # csdn官網鏈接鏈接response = requests.get(url)print(response.status_code) # response.status_code: 檢查響應的狀態碼

200

請求⽅式

requests的幾種請求方式:

p = requests.get(url)p = requests.post(url)p = requests.put(url,data={’key’:’value’})p = requests.delete(url)p = requests.head(url)p = requests.options(url)GET請求

HTTP默認的請求方法就是GET* 沒有請求體* 數據必須在1K之內!* GET請求數據會暴露在瀏覽器的地址欄中

GET請求常用的操作:1. 在瀏覽器的地址欄中直接給出URL,那么就一定是GET請求2. 點擊頁面上的超鏈接也一定是GET請求3. 提交表單時,表單默認使用GET請求,但可以設置為POST

POST請求

(1). 數據不會出現在地址欄中(2). 數據的大小沒有上限(3). 有請求體(4). 請求體中如果存在中文,會使用URL編碼!

requests.post()用法與requests.get()完全一致,特殊的是requests.post()有一個data參數,用來存放請求體數據

請求頭

當我們打開一個網頁時,瀏覽器要向網站服務器發送一個HTTP請求頭,然后網站服務器根據HTTP請求頭的內容生成當此請求的內容發送給服務器。我們可以手動設定請求頭的內容:

import requestsheader = { ’User-Agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36’}url = ’https://www.csdn.net/’reponse = requests.get(url,headers=header)#打印文本形式print(reponse.text)requests設置代理

使⽤requests添加代理只需要在請求⽅法中(get/post)傳遞proxies參數就可以了

cookie

cookie :通過在客戶端記錄的信息確定⽤戶身份

HTTP是⼀種⽆連接協議,客戶端和服務器交互僅僅限于 請求/響應過程,結束后 斷開,下⼀次請求時,服務器會認為是⼀個新的客戶端,為了維護他們之間的連接, 讓服務器知道這是前⼀個⽤戶發起的請求,必須在⼀個地⽅保存客戶端信息。

requests操作Cookies很簡單,只需要指定cookies參數即可

import requests#這段cookies是從CSDN官網控制臺中復制的header = { ’User-Agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36’, ’cookie’: ’uuid_tt_dd=10_30835064740-1583844255125-466273; dc_session_id=10_1583844255125.696601; __gads=ID=23811027bd34da29:T=1583844256:S=ALNI_MY6f7VlmNJKxrkHd2WKUIBQ34Bbnw; UserName=xdc1812547560; UserInfo=708aa833b2064ba9bb8ab0be63866b58; UserToken=708aa833b2064ba9bb8ab0be63866b58; UserNick=xdc1812547560; AU=F85; UN=xdc1812547560; BT=1590317415705; p_uid=U000000; Hm_ct_6bcd52f51e9b3dce32bec4a3997715ac=6525*1*10_30835064740-1583844255125-466273!5744*1*xdc1812547560; Hm_up_6bcd52f51e9b3dce32bec4a3997715ac=%7B%22islogin%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isonline%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isvip%22%3A%7B%22value%22%3A%220%22%2C%22scope%22%3A1%7D%2C%22uid_%22%3A%7B%22value%22%3A%22xdc1812547560%22%2C%22scope%22%3A1%7D%7D; log_Id_click=1; Hm_lvt_feacd7cde2017fd3b499802fc6a6dbb4=1595575203; Hm_up_feacd7cde2017fd3b499802fc6a6dbb4=%7B%22islogin%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isonline%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isvip%22%3A%7B%22value%22%3A%220%22%2C%22scope%22%3A1%7D%2C%22uid_%22%3A%7B%22value%22%3A%22xdc1812547560%22%2C%22scope%22%3A1%7D%7D; Hm_ct_feacd7cde2017fd3b499802fc6a6dbb4=5744*1*xdc1812547560!6525*1*10_30835064740-1583844255125-466273; Hm_up_facf15707d34a73694bf5c0d571a4a72=%7B%22islogin%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isonline%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isvip%22%3A%7B%22value%22%3A%220%22%2C%22scope%22%3A1%7D%2C%22uid_%22%3A%7B%22value%22%3A%22xdc1812547560%22%2C%22scope%22%3A1%7D%7D; Hm_ct_facf15707d34a73694bf5c0d571a4a72=5744*1*xdc1812547560!6525*1*10_30835064740-1583844255125-466273; announcement=%257B%2522isLogin%2522%253Atrue%252C%2522announcementUrl%2522%253A%2522https%253A%252F%252Flive.csdn.net%252Froom%252Fyzkskaka%252Fats4dBdZ%253Futm_source%253D908346557%2522%252C%2522announcementCount%2522%253A0%257D; Hm_lvt_facf15707d34a73694bf5c0d571a4a72=1596946584,1597134917,1597155835,1597206739; searchHistoryArray=%255B%2522%25E8%258F%259C%25E9%25B8%259FIT%25E5%25A5%25B3%2522%252C%2522%25E5%25AE%25A2%25E6%259C%258D%2522%255D; log_Id_pv=7; log_Id_view=8; dc_sid=c0efd34d6da090a1fccd033091e0dc53; TY_SESSION_ID=7d77f76f-a4b1-43ef-9bb5-0aebee8ee475; c_ref=https%3A//www.baidu.com/link; c_first_ref=www.baidu.com; c_first_page=https%3A//www.csdn.net/; Hm_lvt_6bcd52f51e9b3dce32bec4a3997715ac=1597245305,1597254589,1597290418,1597378513; c_segment=1; dc_tos=qf1jz2; Hm_lpvt_6bcd52f51e9b3dce32bec4a3997715ac=1597387359’}url = ’https://www.csdn.net/’reponse = requests.get(url,headers=header)#打印文本形式print(reponse.text)session

session :通過在服務端記錄的信息確定⽤戶身份這⾥這個session就是⼀個指 的是會話會話對象是一種高級的用法,可以跨請求保持某些參數,比如在同一個Session實例之間保存Cookie,像瀏覽器一樣,我們并不需要每次請求Cookie,Session會自動在后續的請求中添加獲取的Cookie,這種處理方式在同一站點連續請求中特別方便

處理不信任的SSL證書

什么是SSL證書?SSL證書是數字證書的⼀種,類似于駕駛證、護照和營業執照的電⼦副本。

因為配置在服務器上,也稱為SSL服務器證書。SSL 證書就是遵守 SSL協 議,由受信任的數字證書頒發機構CA,在驗證服務器身份后頒發,具有服務 器身份驗證和數據傳輸加密功能我們來爬一個證書不太合格的網站

python 爬蟲請求模塊requests詳解

import requestsurl = ’https://inv-veri.chinatax.gov.cn/’resp = requests.get(url)print(resp.text)

它報了一個錯

python 爬蟲請求模塊requests詳解

我們來修改一下代碼

import requestsurl = ’https://inv-veri.chinatax.gov.cn/’resp = requests.get(url,verify = False)print(resp.text)

我們的代碼又能成功爬取了

python 爬蟲請求模塊requests詳解

到此這篇關于python 爬蟲請求模塊requests的文章就介紹到這了,更多相關python 爬蟲requests模塊內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 上海盐水喷雾试验机_两厢式冷热冲击试验箱-巨怡环试 | 碳化硅,氮化硅,冰晶石,绢云母,氟化铝,白刚玉,棕刚玉,石墨,铝粉,铁粉,金属硅粉,金属铝粉,氧化铝粉,硅微粉,蓝晶石,红柱石,莫来石,粉煤灰,三聚磷酸钠,六偏磷酸钠,硫酸镁-皓泉新材料 | 冷却塔降噪隔音_冷却塔噪声治理_冷却塔噪音处理厂家-广东康明冷却塔降噪厂家 | 短信通106短信接口验证码接口群发平台_国际短信接口验证码接口群发平台-速度网络有限公司 | AR开发公司_AR增强现实_AR工业_AR巡检|上海集英科技 | 工业淬火油烟净化器,北京油烟净化器厂家,热处理油烟净化器-北京众鑫百科 | 玉米深加工机械,玉米加工设备,玉米加工机械等玉米深加工设备制造商-河南成立粮油机械有限公司 | 有声小说,听书,听小说资源库-听世界网| 全国冰箱|空调|洗衣机|热水器|燃气灶维修服务平台-百修家电 | 粉末包装机,拆包机厂家,价格-上海强牛包装机械设备有限公司 | 袋式过滤器,自清洗过滤器,保安过滤器,篮式过滤器,气体过滤器,全自动过滤器,反冲洗过滤器,管道过滤器,无锡驰业环保科技有限公司 | 对辊式破碎机-对辊制砂机-双辊-双齿辊破碎机-巩义市裕顺机械制造有限公司 | 三轴曲线机-端子插拔力试验机|华杰仪器 | 体检车_移动CT车_CT检查车_CT车_深圳市艾克瑞电气有限公司移动CT体检车厂家-深圳市艾克瑞电气有限公司 | 重庆监控_电子围栏设备安装公司_门禁停车场管理系统-劲浪科技公司 | 老城街小面官网_正宗重庆小面加盟技术培训_特色面馆加盟|牛肉拉面|招商加盟代理费用多少钱 | 暖气片十大品牌厂家_铜铝复合暖气片厂家_暖气片什么牌子好_欣鑫达散热器 | 真空搅拌机-行星搅拌机-双行星动力混合机-广州市番禺区源创化工设备厂 | 闭端端子|弹簧螺式接线头|防水接线头|插线式接线头|端子台|电源线扣+护线套|印刷电路板型端子台|金笔电子代理商-上海拓胜电气有限公司 | 深圳市源和塑胶电子有限公司-首页| 气力输送设备_料封泵_仓泵_散装机_气化板_压力释放阀-河南锐驰机械设备有限公司 | 专业的新乡振动筛厂家-振动筛品质保障-环保振动筛价格—新乡市德科筛分机械有限公司 | 钢制拖链生产厂家-全封闭钢制拖链-能源钢铝拖链-工程塑料拖链-河北汉洋机械制造有限公司 | 济南律师,济南法律咨询,山东法律顾问-山东沃德律师事务所 | 长沙广告公司|长沙广告制作设计|长沙led灯箱招牌制作找望城湖南锦蓝广告装饰工程有限公司 | 镀锌角钢_槽钢_扁钢_圆钢_方矩管厂家_镀锌花纹板-海邦钢铁(天津)有限公司 | 武汉天安盾电子设备有限公司 - 安盾安检,武汉安检门,武汉安检机,武汉金属探测器,武汉测温安检门,武汉X光行李安检机,武汉防爆罐,武汉车底安全检查,武汉液体探测仪,武汉安检防爆设备 | 圣才学习网-考研考证学习平台,提供万种考研考证电子书、题库、视频课程等考试资料 | 纯化水设备-纯水设备-超纯水设备-[大鹏水处理]纯水设备一站式服务商-东莞市大鹏水处理科技有限公司 | 学叉车培训|叉车证报名|叉车查询|叉车证怎么考-工程机械培训网 | 合肥展厅设计-安徽展台设计-合肥展览公司-安徽奥美展览工程有限公司 | 山东彩钢板房,山东彩钢活动房,临沂彩钢房-临沂市贵通钢结构工程有限公司 | 户外环保不锈钢垃圾桶_标识标牌制作_园林公园椅厂家_花箱定制-北京汇众环艺 | 带压开孔_带压堵漏_带压封堵-菏泽金升管道工程有限公司 | 撕碎机_轮胎破碎机_粉碎机_回收生产线厂家_东莞华达机械有限公司 | 扒渣机厂家_扒渣机价格_矿用扒渣机_铣挖机_撬毛台车_襄阳永力通扒渣机公司 | UV固化机_UVLED光固化机_UV干燥机生产厂家-上海冠顶公司专业生产UV固化机设备 | 钢结构厂房造价_钢结构厂房预算_轻钢结构厂房_山东三维钢结构公司 | 水压力传感器_数字压力传感器|佛山一众传感仪器有限公司|首页 | 软文世界-软文推广-软文营销-新闻稿发布-一站式软文自助发稿平台 | 天空彩票天下彩,天空彩天空彩票免费资料,天空彩票与你同行开奖,天下彩正版资料大全 |