电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Python urllib2運行過程原理解析

瀏覽:115日期:2022-07-22 18:09:49

1.urlopen函數

urllib2.urlopen(url[, data[, timeout[, cafile[, capath[, cadefault[, context]]]]])

注:

url表示目標網頁地址,可以是字符串,也可以是請求對象Request

req= urllib2.Request(url, data,headers) response = urllib2.urlopen(req,timeout=3)

data表示post方式提交給目標服務器的參數

data = urllib.urlencode(data)

import urllib,urllib2 action_url='http://www.xxxxxx.com/post'#用于測試post的網址,返回提交的數據 values={’name’:'alice',’age’:20} data=urllib.urlencode(values)#對表單數據編碼 rqst=urllib2.Request(action_url,data) response=urllib2.urlopen(rqst)#模擬提交表單數據到url并獲得響應

timeout表示超時時間設置。

返回值

response.read()返回頁面內容 response.info()返回網頁信息 response.geturl()返回連接地址

這個函數可以像urllib.urlopen()那樣以url做參數。也能以Request實例為參數,即用一個Request對象(下文構造方法)來映射你提出的HTTP請求,在它最簡單的使用形式中你將用你要請求的地址創建一個Request對象,這個Request對象中可以設置傳輸數據、headers等。通過調用urlopen并傳入Request對象,將返回一個file-like對象。urllib2還提供了接口來處理一般情況,例如:基礎驗證,cookies,代理和其他,它們通過handlers和openers的對象實現。

2、Request函數

urllib2.Request(url[, data][, headers][, origin_req_host][, unverifiable])

用于構造Request對象,可以傳遞data數據,添加請求頭(headers)等,構造好后作為urllib2.urlopen()的參數。

注:

url表示目標網頁地址,可以是字符串,也可以是請求對象Request

data表示post方式提交給目標服務器的參數

headers表示用戶標識,是一個字典類型的數據,有些不允許腳本的抓取,所以需要用戶代理,像火狐瀏覽器的代理就是類似:

Mozilla/5.0 (X11; U; Linux i686)Gecko/20071127 Firefox/2.0.0.11

瀏覽器的標準UA格式為:瀏覽器標識 (操作系統標識; 加密等級標識; 瀏覽器語言) 渲染引擎標識 版本信息 ,headers默認是

Python-urllib/2.6

origin_req_host表示請求方的主機域名或者ip地址。

headers = {’User-Agent’:’Mozilla/5.0 (X11; U; Linux i686)Gecko/20071127 Firefox/2.0.0.11’}

import urllib import urllib2 url = ’http://www.weibo.cn/’ user_agent = ’Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)’ h = { ’User-Agent’ : user_agent } req = urllib2.Request(url,headers=h) response = urllib2.urlopen(req) print response.read()

3、build_opener()

build_opener([handler1 [ handler2, ... ]])

urllib2.urlopen()函數不支持驗證、cookie或者其它HTTP高級功能。要支持這些功能,必須使用build_opener()函數創建自定義Opener對象。

參數handler是Handler實例,常用的有HTTPBasicAuthHandler、HTTPCookieProcessor、ProxyHandler等。build_opener ()返回的對象具有open()方法,與urlopen()函數的功能相同。

如果要修改http報頭,可以用:

import urllib2 opener = urllib2.build_opener() opener.addheaders = [(’User-agent’, ’Mozilla/5.0’)] opener.open(’http://www.example.com/’)

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 量子管通环-自清洗过滤器-全自动反冲洗过滤器-沼河浸过滤器 | 电力电子产业网 | 碳化硅,氮化硅,冰晶石,绢云母,氟化铝,白刚玉,棕刚玉,石墨,铝粉,铁粉,金属硅粉,金属铝粉,氧化铝粉,硅微粉,蓝晶石,红柱石,莫来石,粉煤灰,三聚磷酸钠,六偏磷酸钠,硫酸镁-皓泉新材料 | 车充外壳,车载充电器外壳,车载点烟器外壳,点烟器连接头,旅行充充电器外壳,手机充电器外壳,深圳市华科达塑胶五金有限公司 | 电伴热系统施工_仪表电伴热保温箱厂家_沃安电伴热管缆工业技术(济南)有限公司 | 济南货架定做_仓储货架生产厂_重型货架厂_仓库货架批发_济南启力仓储设备有限公司 | 蓄电池回收,ups电池后备电源回收,铅酸蓄电池回收,机房电源回收-广州益夫铅酸电池回收公司 | 检验科改造施工_DSA手术室净化_导管室装修_成都特殊科室建设厂家_医疗净化工程公司_四川华锐 | 光泽度计_测量显微镜_苏州压力仪_苏州扭力板手维修-苏州日升精密仪器有限公司 | PO膜_灌浆膜及地膜供应厂家 - 青州市鲁谊塑料厂 | 东莞画册设计_logo/vi设计_品牌包装设计 - 华略品牌设计公司 | 药品/药物稳定性试验考察箱-埃里森仪器设备(上海)有限公司 | 云杂志网-学术期刊-首页| 三佳互联一站式网站建设服务|网站开发|网站设计|网站搭建服务商 赛默飞Thermo veritiproPCR仪|ProFlex3 x 32PCR系统|Countess3细胞计数仪|371|3111二氧化碳培养箱|Mirco17R|Mirco21R离心机|仟诺生物 | BOE画框屏-触摸一体机-触控查询一体机-触摸屏一体机价格-厂家直销-触发电子 | 我车网|我关心的汽车资讯_汽车图片_汽车生活! | 团建-拓展-拓展培训-拓展训练-户外拓展训练基地[无锡劲途] | 九爱图纸|机械CAD图纸下载交流中心 | 河北中仪伟创试验仪器有限公司是专业生产沥青,土工,水泥,混凝土等试验仪器的厂家,咨询电话:13373070969 | 水质传感器_水质监测站_雨量监测站_水文监测站-山东水境传感科技有限公司 | 齿辊分级破碎机,高低压压球机,立式双动力磨粉机-郑州长城冶金设备有限公司 | 手术室净化厂家_成都实验室装修公司_无尘车间施工单位_洁净室工程建设团队-四川华锐16年行业经验 | 湖南教师资格网-湖南教师资格证考试网 | 旋振筛|圆形摇摆筛|直线振动筛|滚筒筛|压榨机|河南天众机械设备有限公司 | 附着力促进剂-尼龙处理剂-PP处理剂-金属附着力处理剂-东莞市炅盛塑胶科技有限公司 | 石英砂矿石色选机_履带辣椒色选机_X光异物检测机-合肥幼狮光电科技 | 热工多功能信号校验仪-热电阻热电偶校验仿真仪-金湖虹润仪表 | 恒湿机_除湿加湿一体机_恒湿净化消毒一体机厂家-杭州英腾电器有限公司 | 称重传感器,测力传感器,拉压力传感器,压力变送器,扭矩传感器,南京凯基特电气有限公司 | 广州小程序开发_APP开发公司_分销商城系统定制_小跑科技 | 国际线缆连接网 - 连接器_线缆线束加工行业门户网站 | 汽车水泵_汽车水泵厂家-瑞安市骏迪汽车配件有限公司 | 浙江自考_浙江自学考试网| 南京雕塑制作厂家-不锈钢雕塑制作-玻璃钢雕塑制作-先登雕塑厂 | 上海地磅秤|电子地上衡|防爆地磅_上海地磅秤厂家–越衡称重 | 烟台游艇培训,威海游艇培训-烟台市邮轮游艇行业协会 | SMN-1/SMN-A ABB抽屉开关柜触头夹紧力检测仪-SMN-B/SMN-C-上海徐吉 | 消泡剂-水处理消泡剂-涂料消泡剂-切削液消泡剂价格-东莞德丰消泡剂厂家 | 2025黄道吉日查询、吉时查询、老黄历查询平台- 黄道吉日查询网 | 磁力抛光研磨机_超声波清洗机厂家_去毛刺设备-中锐达数控 | 三价铬_环保铬_环保电镀_东莞共盈新材料贸易有限公司 |