电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

python 制作網站篩選工具(附源碼)

瀏覽:105日期:2022-06-29 13:49:23
一.思路1.整體思路

python 制作網站篩選工具(附源碼)

2.代碼思路

python 制作網站篩選工具(附源碼)

思路很簡單,就是用python發送請求,提取響應體中的狀態碼加以判斷,最后保存到本地txt文本中,以實現網站信息的篩選。

二.撰寫代碼

import timeimport requestsimport urllib3from concurrent.futures import ThreadPoolExecutor#取源文件中的網址并且去重def get_url(old_file): with open(old_file,’r’,encoding=’gbk’)as f: urllist=list(set(f.readlines())) return urllist#主體,發送請求,通過異常捕獲判斷能否響應,通過狀態碼判斷網閘能否正常訪問def request(url): url=url.strip() #構造請求頭信息 headers = { ’Connection’: ’keep-alive’, ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36’ } try: #忽略證書安全警告 urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning) r=requests.get(url,headers=headers,timeout=10,verify=False)#timeout設置超時時間,我設置了10s,使用verif=False忽略sll認證 if r.status_code==200: cost_time=r.elapsed.total_seconds()#計算訪問耗時 print(url,’ ----->【能訪問】訪問耗時:033[35;46m{:.2f}s033[0m’.format(cost_time)) can_access_save_to_txt(url) else: print(url,’ ----->不能訪問,狀態碼為:033[31;44m{}033[0m’.format(r.status_code)) except: print(url, ’ ----->不能訪問,原因:033[31;44m不能響應033[0m’)#將能訪問的網址保存到new_filedef can_access_save_to_txt(result): result=result.strip() #篩選出不是.apk的url,此判斷可以不加 if not result.endswith(’.apk’): with open(aim_file,’a’)as f: f.write(result+’n’)def main(): s_time=time.time() #使用線程池,創建四條線程。 pool=ThreadPoolExecutor(max_workers=4) urls=get_url(orign_file) for url in urls: pool.submit(request,url) pool.shutdown() e_time=time.time() sum_time=int(e_time-s_time) if sum_time>60: print(f’033[38;46m 程序正常執行結束退出!共耗時:【{sum_time//60}分鐘】 033[0m’) elif sum_time/60>1: print(f’033[38;46m 程序正常執行結束退出!共耗時:【{sum_time//60*60}小時】 033[0m’)if __name__ == ’__main__’: orign_file=r’E:test.txt’ #篩選后能訪問的網址 aim_file='./data/test_can_access.txt' #篩選后不能訪問的網址 main()三.運行結果

python 制作網站篩選工具(附源碼)

四.總結

本次使用python撰寫了一款篩選網站的小工具,將網站大致分為能訪問和不能訪問兩類,將能夠訪問且狀態碼為200的網站存儲到了文件中,最終實現了網站的篩選。思路、代碼方面有什么不足歡迎各位大佬指正、批評!

以上就是python 制作網站篩選工具(附源碼)的詳細內容,更多關于python 制作網站篩選工具的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 东莞ERP软件_广州云ERP_中山ERP_台湾工厂erp系统-广东顺景软件科技有限公司 | PTFE接头|聚四氟乙烯螺丝|阀门|薄膜|消解罐|聚四氟乙烯球-嘉兴市方圆氟塑制品有限公司 | 辐射仪|辐射检测仪|辐射巡测仪|个人剂量报警仪|表面污染检测仪|辐射报警仪|辐射防护网 | POS机官网 - 拉卡拉POS机免费办理|官网在线申请入口 | 河南凯邦机械制造有限公司| 卫浴散热器,卫浴暖气片,卫生间背篓暖气片,华圣格浴室暖气片 | 建筑资质代办_工程施工资质办理_资质代办公司_北京众聚企服 | 昆山PCB加工_SMT贴片_PCB抄板_线路板焊接加工-昆山腾宸电子科技有限公司 | 布袋除尘器|除尘器设备|除尘布袋|除尘设备_诺和环保设备 | 99文库_实习生实用的范文资料文库站 | [品牌官网]贵州遵义双宁口腔连锁_贵州遵义牙科医院哪家好_种植牙_牙齿矫正_原华美口腔 | 镀锌角钢_槽钢_扁钢_圆钢_方矩管厂家_镀锌花纹板-海邦钢铁(天津)有限公司 | 购买舔盐、舔砖、矿物质盐压块机,鱼饵、鱼饲料压块机--请到杜甫机械 | 焦作网 WWW.JZRB.COM | 济南ISO9000认证咨询代理公司,ISO9001认证,CMA实验室认证,ISO/TS16949认证,服务体系认证,资产管理体系认证,SC食品生产许可证- 济南创远企业管理咨询有限公司 郑州电线电缆厂家-防火|低压|低烟无卤电缆-河南明星电缆 | 安徽控制器-合肥船用空调控制器-合肥家电控制器-合肥迅驰电子厂 安徽净化板_合肥岩棉板厂家_玻镁板厂家_安徽科艺美洁净科技有限公司 | 柴油机_柴油发电机_厂家_品牌-江苏卡得城仕发动机有限公司 | 高铝轻质保温砖_刚玉莫来石砖厂家_轻质耐火砖价格 | 软文世界-软文推广-软文营销-新闻稿发布-一站式软文自助发稿平台 | 太空舱_民宿太空舱厂家_移动房屋太空舱价格-豪品建筑 | 巨野月嫂-家政公司-巨野县红墙安康母婴护理中心 | 日本东丽膜_反渗透膜_RO膜价格_超滤膜_纳滤膜-北京东丽阳光官网 日本细胞免疫疗法_肿瘤免疫治疗_NK细胞疗法 - 免疫密码 | 【铜排折弯机,钢丝折弯成型机,汽车发泡钢丝折弯机,线材折弯机厂家,线材成型机,铁线折弯机】贝朗折弯机厂家_东莞市贝朗自动化设备有限公司 | 防爆型气象站_农业气象站_校园气象站_农业四情监测系统「山东万象环境科技有限公司」 | 超细粉碎机|超微气流磨|气流分级机|粉体改性设备|超微粉碎设备-山东埃尔派粉碎机厂家 | 骁龙云呼电销防封号系统-axb电销平台-外呼稳定『免费试用』 | 食品质构分析仪-氧化诱导分析仪-瞬态法导热系数仪|热冰百科 | 钢结构-钢结构厂房-钢结构工程[江苏海逵钢构厂] | 生物风-销售载体,基因,质粒,ATCC细胞,ATCC菌株等,欢迎购买-百风生物 | 代办建筑资质升级-建筑资质延期就找上海国信启航 | 深圳美安可自动化设备有限公司,喷码机,定制喷码机,二维码喷码机,深圳喷码机,纸箱喷码机,东莞喷码机 UV喷码机,日期喷码机,鸡蛋喷码机,管芯喷码机,管内壁喷码机,喷码机厂家 | 菏泽商标注册_菏泽版权登记_商标申请代理_菏泽商标注册去哪里 | 石油/泥浆/不锈钢防腐/砂泵/抽砂泵/砂砾泵/吸砂泵/压滤机泵 - 专业石油环保专用泵厂家 | 密集架-密集柜厂家-智能档案密集架-自动选层柜订做-河北风顺金属制品有限公司 | 肉嫩度仪-凝胶测试仪-国产质构仪-气味分析仪-上海保圣实业发展有限公司|总部 | 精密机械零件加工_CNC加工_精密加工_数控车床加工_精密机械加工_机械零部件加工厂 | 旗帜网络笔记-免费领取《旗帜网络笔记》电子书| 物联网卡_物联网卡购买平台_移动物联网卡办理_移动联通电信流量卡通信模组采购平台? | 苏州防水公司_厂房屋面外墙防水_地下室卫生间防水堵漏-苏州伊诺尔防水工程有限公司 | 数码听觉统合训练系统-儿童感觉-早期言语评估与训练系统-北京鑫泰盛世科技发展有限公司 | 无锡网站建设_小程序制作_网站设计公司_无锡网络公司_网站制作 |