电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

python 爬取知乎回答下的微信8.0狀態視頻

瀏覽:141日期:2022-06-24 11:32:19

微信 8.0 版本更新后,可以設置個人狀態,狀態里面可以添加火錄制視頻,很快狀態視頻就火了,可以看下知乎熱榜有沒有微信8.0狀態沙雕又可愛的視頻或圖片?[1]。比如我也設置了一個:

于是我就想把這些視頻下載下來,也玩一玩。本文講述如何使用 Python 一鍵下載知乎某個回答下的所有視頻。

思路:分析知乎回答頁面 -> 定位視頻 -> 尋找視頻播放的 url -> 下載。其實就兩步:找到 url,然后下載。

尋找 url

一個回答下面可能有多個視頻,先分析一個視頻,打開谷歌瀏覽器的開發者工具窗口,找到 network,勾選 preserve log、disable cache,選擇 xhr,刷新,很容易找到如下圖所示的接口:

python 爬取知乎回答下的微信8.0狀態視頻

從上圖接口返回的數據就可以獲取視頻播放的 url、標題、格式等信息,這就夠了,復制 play_url,放在瀏覽器上看一下,發現可以直接下載,說明那么這個 url 就是我們需要的。

python 爬取知乎回答下的微信8.0狀態視頻

接下來,寫代碼,獲取接口返回的數據:

def get(url: str) -> list: ''' 獲取知乎視頻的 url 返回格式 [{’url’:’’, ’title’,’format’:’’,},{}] ''' data = [] headers = { 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 11_1_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36', } with requests.get(url, headers=headers, timeout=10) as rep: if rep.status_code == 200: ids = re.findall(r'www.zhihu.com/zvideo/(d{1,})', rep.text) ids = list(set(ids)) # 去掉重復元素 else: print(f'網絡連接失敗,狀態碼 { rep.status_code }') return [] if not ids: print('視頻獲取失敗,可能是這個頁面沒有視頻') return [] for id in ids: print(id) with requests.get( f'https://www.zhihu.com/api/v4/zvideos/{id}/card', headers=headers, timeout=10, ) as rep: if rep.status_code == 200:ret_data = rep.json()playlist = ret_data['video']['playlist']title = ret_data.get('title')temp = playlist.get('ld') or playlist.get('sd')if temp: sigle_video = {} sigle_video['url'] = temp.get('play_url') sigle_video['title'] = title sigle_video['format'] = temp.get('format') data.append(sigle_video) else:print(f'網絡連接失敗,狀態碼 { rep.status_code }')return [] return data下載視頻

這個比較簡單了,直接請求視頻播放的 url,將流式的內容保存到文件中,最多再加個進度條的展示。部分視頻獲取的 title 為空,這時就使用時間戳來命名文件。

請看代碼:

def download( file_url, file_name=None, file_type=None, save_path='download', headers=None, timeout=15,): ''' :param file_url: 下載資源鏈接 :param file_name: 保存文件名,默認為當前日期時間 :param file_type: 文件類型(擴展名) :param save_path: 保存路徑,默認為download,后面不要'/' :param headers: http請求頭 ''' if file_name is None or file_name == '': file_name = str(datetime.now()) if file_type is None: if '.' in file_url: file_type = file_url.split('.')[-1] else: file_type = 'uknown' file_name = file_name + '.' + file_type if headers is None: headers = { 'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B137 Safari/601.1' } if os.path.exists(save_path): pass else: os.mkdir(save_path) # 下載提示 if os.path.exists(f'{save_path}/{file_name}'): print(f'033[33m{file_name}已存在,不再下載!033[0m') return True print(f'Downloading {file_name}') try: with requests.get( file_url, headers=headers, stream=True, timeout=timeout ) as rep: file_size = int(rep.headers['Content-Length']) if rep.status_code != 200:print('033[31m下載失敗033[0m')return False label = '{:.2f}MB'.format(file_size / (1024 * 1024)) with click.progressbar(length=file_size, label=label) as progressbar:with open(f'{save_path}/{file_name}', 'wb') as f: for chunk in rep.iter_content(chunk_size=1024): if chunk: f.write(chunk) progressbar.update(1024) print(f'033[32m{file_name}下載成功033[0m') except Exception as e: print('下載失敗: ', e) return True執行代碼下載:

import os, sysimport reimport clickimport requestsfrom datetime import datetimedef get(url: str) -> list: #見上文 ...def download( file_url, file_name=None, file_type=None, save_path='download', headers=None, timeout=15,): #見上文 ...if __name__ == '__main__': videos = get(sys.argv[1]) for video in videos: download(file_url = video[’url’],file_name= video[’title’] ,file_type= video[’format’],save_path=’./download’)

執行結果如下圖所示:

最后的話

網站可能會發生變更,因此本文的代碼可能隨著時間變化而無法使用,請自行調節一些正則表達式和參數。爬取的思路是通用的,無非就是找到視頻的流式數據,進行保存。思路有了,編寫代碼就是體力活了。

此外,如果你只是想要一些酷炫、搞笑、可愛的視頻資源,玩一下微信 8.0 的狀態,請在公眾號「Python七號」回復「視頻」,即可獲取微信 8.0 的狀態視頻合集的下載鏈接:

python 爬取知乎回答下的微信8.0狀態視頻

回答來源

有沒有微信8.0狀態沙雕又可愛的視頻或圖片?: https://www.zhihu.com/question/441253090

以上就是python 爬取知乎回答下的微信8.0狀態視頻的詳細內容,更多關于python 爬取知乎視頻的資料請關注好吧啦網其它相關文章!

標簽: 微信 Python
相關文章:
主站蜘蛛池模板: 亚克力制品定制,上海嘉定有机玻璃加工制作生产厂家—官网 | 塑料薄膜_PP薄膜_聚乙烯薄膜-常州市鑫美新材料包装厂 | 布袋除尘器|除尘器设备|除尘布袋|除尘设备_诺和环保设备 | 番茄畅听邀请码怎么输入 - Dianw8.com | 地磅-电子地磅维修-电子吊秤-汽车衡-无人值守系统-公路治超-鹰牌衡器 | 绿叶|绿叶投资|健康产业_绿叶投资集团有限公司 | PO膜_灌浆膜及地膜供应厂家 - 青州市鲁谊塑料厂 | 聚合氯化铝_喷雾聚氯化铝_聚合氯化铝铁厂家_郑州亿升化工有限公司 | 工业铝型材生产厂家_铝合金型材配件批发精加工定制厂商 - 上海岐易铝业 | 冷油器,取样冷却器,热力除氧器-连云港振辉机械设备有限公司 | 高精度-恒温冷水机-螺杆式冰水机-蒸发冷冷水机-北京蓝海神骏科技有限公司 | 六维力传感器_六分量力传感器_模腔压力传感器-南京数智微传感科技有限公司 | 365文案网_全网创意文案句子素材站| 电动不锈钢套筒阀-球面偏置气动钟阀-三通换向阀止回阀-永嘉鸿宇阀门有限公司 | 衬四氟_衬氟储罐_四氟储罐-无锡市氟瑞特防腐科技有限公司 | 氢氧化钙设备, 氢氧化钙生产线-淄博惠琛工贸有限公司 | 蒸汽吸附分析仪-进口水分活度仪|康宝百科| 南京PVC快速门厂家南京快速卷帘门_南京pvc快速门_世界500强企业国内供应商_南京美高门业 | 冷水机,风冷冷水机,水冷冷水机,螺杆冷水机专业制造商-上海祝松机械有限公司 | 云南成考网_云南成人高考报名网| 塑钢课桌椅、学生课桌椅、课桌椅厂家-学仕教育设备首页 | 铝镁锰板_铝镁锰合金板_铝镁锰板厂家_铝镁锰金属屋面板_安徽建科 | Akribis直线电机_直线模组_力矩电机_直线电机平台|雅科贝思Akribis-杭州摩森机电科技有限公司 | 亳州网络公司 - 亳州网站制作 - 亳州网站建设 - 亳州易天科技 | 大学食堂装修设计_公司餐厅效果图_工厂食堂改造_迈普装饰 | 膜片万向弹性联轴器-冲压铸造模具「沧州昌运模具」 | 湖州织里童装_女童男童中大童装_款式多尺码全_织里儿童网【官网】-嘉兴嘉乐网络科技有限公司 | 山东柳店新能源科技有限公司| 旗杆生产厂家_不锈钢锥形旗杆价格_铝合金电动旗杆-上海锥升金属科技有限公司 | ISO9001认证咨询_iso9001企业认证代理机构_14001|18001|16949|50430认证-艾世欧认证网 | 北京易通慧公司从事北京网站优化,北京网络推广、网站建设一站式服务商-北京网站优化公司 | 工业淬火油烟净化器,北京油烟净化器厂家,热处理油烟净化器-北京众鑫百科 | 商用绞肉机-熟肉切片机-冻肉切丁机-猪肉开条机 - 广州市正盈机械设备有限公司 | 淄博不锈钢,淄博不锈钢管,淄博不锈钢板-山东振远合金科技有限公司 | 电池挤压试验机-自行车喷淋-车辆碾压试验装置-深圳德迈盛测控设备有限公司 | 无线遥控更衣吊篮_IC卡更衣吊篮_电动更衣吊篮配件_煤矿更衣吊篮-力得电子 | 石磨面粉机|石磨面粉机械|石磨面粉机组|石磨面粉成套设备-河南成立粮油机械有限公司 | 英语词典_成语词典_日语词典_法语词典_在线词典网 | 蔬菜清洗机_环速洗菜机_异物去除清洗机_蔬菜清洗机_商用洗菜机 - 环速科技有限公司 | 东莞工厂厂房装修_无尘车间施工_钢结构工程安装-广东集景建筑装饰设计工程有限公司 | 北京亦庄厂房出租_经开区产业园招商信息平台 |