电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

python實現模擬器爬取抖音評論數據的示例代碼

瀏覽:18日期:2022-06-30 11:42:35
目標:

由于之前和朋友聊到抖音評論的爬蟲,demo做出來之后一直沒整理,最近時間充裕后,在這里做個筆記。提示:大體思路 通過fiddle + app模擬器進行抖音抓包,使用python進行數據整理

安裝需要的工具:

python3 下載fiddle 安裝及配置手機模擬器下載

抖音部分:

模擬器下載好之后, 打開模擬器在應用市場下載抖音

python實現模擬器爬取抖音評論數據的示例代碼

對抖音進行fiddle配置,配置成功后就可以當手機一樣使用了

一、工具配置及抓包:

我們隨便打開一個視頻之后,fiddle就會刷新新的數據包

python實現模擬器爬取抖音評論數據的示例代碼

在json中找到視頻地址:

python實現模擬器爬取抖音評論數據的示例代碼

二、fiddler中添加下載視頻評論代碼

在fiddler中添加下載視頻代碼:注意兩點:(1)get后面的路徑要隨時看進行更換(2)下載的路徑要在fiddler下面自己新建

if (m_Hide304s && oSession.responseCode == 304) { oSession['ui-hide'] = 'true'; }if (oSession.uriContains('https://aweme.snssdk.com/aweme/v1/general/search/single/')){ var strBody=oSession.GetResponseBodyAsString(); var sps = oSession.PathAndQuery.slice(-58,); //FiddlerObject.alert(sps) var timestamp=new Date().getTime(); var filename = 'D:抖音評論資料' + '/' + sps + timestamp + '.json'; var curDate = new Date(); var sw : System.IO.StreamWriter; if (System.IO.File.Exists(filename)){ sw = System.IO.File.AppendText(filename); sw.Write(strBody); } else{ sw = System.IO.File.CreateText(filename); sw.Write(strBody); } sw.Close(); sw.Dispose();

此段代碼放到fiddler中的script的response中,如下圖:添加好之后別忘記保存??!

python實現模擬器爬取抖音評論數據的示例代碼

三、python執行代碼pycharm新建py文件

程序執行代碼:

import osimport jsonimport timeimport requestsimport reimport csvclass Douyin(object): def __init__(self): pass self.url1 = ’https://aweme.snssdk.com/aweme/v2/comment/list/?aweme_id=6885929189950737676&cursor=0&count=20&address_book_access=1&gps_access=1&forward_page_type=1&channel_id=0&city=310000&hotsoon_filtered_count=0&hotsoon_has_more=0&follower_count=0&is_familiar=0&page_source=0&os_api=25&device_type=VOG-AL00&ssmix=a&manifest_version_code=110301&dpi=240&uuid=868594157367551&app_name=aweme&version_name=11.3.0&ts=1603350069&cpu_support64=false&app_type=normal&ac=wifi&host_abi=armeabi-v7a&channel=aweGW&update_version_code=11309900&_rticket=1603350070959&device_platform=android&iid=1758845207590062&version_code=110300&mac_address=b0%3Ac4%3A2d%3Ad0%3Aed%3A38&cdid=7974198e-c4c0-49c2-bfaa-43686052706e&openudid=d0c6cffa7067bedd&device_id=844047245117672&resolution=720*1280&device_brand=HUAWEI&language=zh&os_version=7.1.2&aid=1128&mcc_mnc=46000’ self.url2 = ’https://aweme.snssdk.com/aweme/v2/comment/list/?aweme_id=6885163969477086479&cursor=0&count=20’ self.header = { ’Accept-Encoding’: ’gzip’, ’X-SS-REQ-TICKET’: ’1603350070957’, ’sdk-version’: ’1’, ’Cookie’: ’install_id=1758845207590062; ttreq=1$34f012b99d70a66f681dc3d1f0b438fc1b161af3; d_ticket=77247c94236bf8055c233f8cabb6a5ddf3231; odin_tt=fccb20add45a15f08a2519eadcaaf22cba4b3f8f1fceec300a088407c2daf81ea76b260ef6c81dbc86dfedfea011f68c25238f9b3984fe4f5909441dfd1cc9c2; sid_guard=6de18a966e69dcbbf076f629a2ef6511%7C1603345424%7C5184000%7CMon%2C+21-Dec-2020+05%3A43%3A44+GMT; uid_tt=ba98af780b4e337f01463cf98a8afafd; sid_tt=6de18a966e69dcbbf076f629a2ef6511; sessionid=6de18a966e69dcbbf076f629a2ef6511’, ’x-tt-token’: ’006de18a966e69dcbbf076f629a2ef651189d3f6f73fd3d6319b543d50d2e2e5a4cf3e383f8da81f07e049bcf850de07d331’, ’X-Gorgon’: ’0404d8210000a6a3dca0dbc6b11483a82420c9a94dd050a3e511’, ’X-Khronos’: ’1603350070’, ’Host’: ’aweme.nssdk.com’, ’Connection’: ’Keep-Alive’, ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36’, } self.add = ’D:抖音評論資料’ self.videos_list = os.listdir(’D:抖音評論資料’) def parse(self): ’鏈接,內容,發布人昵稱,發布時間,點贊數,評論數,分享數’ lists = [] for vid in self.videos_list: a = open(’D:抖音評論資料{}’.format(vid),encoding=’utf-8’) content = json.load(a) for con in content[’data’]:meta = {}try: meta[’title’] = con[’aweme_info’][’desc’] meta[’author_name’] = con[’aweme_info’][’author’][’nickname’] meta[’u_name’] = con[’aweme_info’][’author’][’unique_id’] meta[’create_time’] = con[’aweme_info’][’create_time’] timeArray = time.localtime(meta[’create_time’]) meta[’create_time’] = time.strftime('%Y--%m--%d %H:%M:%S', timeArray) meta[’digg_count’] = con[’aweme_info’][’statistics’][’digg_count’] meta[’comment_count’] = con[’aweme_info’][’statistics’][’comment_count’] meta[’share_count’] = con[’aweme_info’][’statistics’][’share_count’] meta[’share_url’] = con[’aweme_info’][’share_url’]except: meta[’title’] = ’’ meta[’author_name’] = ’’ meta[’u_name’] = ’’ meta[’create_time’] = ’’ meta[’digg_count’] = ’’ meta[’comment_count’] = ’’ meta[’share_count’] = ’’ meta[’share_url’] = ’’if meta[’u_name’] == ’’: try: meta[’u_name’] = con[’aweme_info’][’music’][’owner_handle’] except: meta[’u_name’] = ’’if meta[’title’] == ’’: passelse: lists.append(meta) # print(meta) return lists def save_data(self, meta): header = [’share_url’, ’title’, ’author_name’, ’u_name’, ’create_time’, ’digg_count’, ’comment_count’, ’share_count’] print(meta) with open(’test.csv’, ’a’, newline=’’, encoding=’utf-8-sig’) as f: writer = csv.DictWriter(f, fieldnames=header) writer.writeheader() # 寫入列名 writer.writerows(meta) def run(self): meta = self.parse() self.save_data(meta)if __name__ == ’__main__’: douyin = Douyin() douyin.run()

運行代碼后在代碼執行目錄下會生成一個excel

python實現模擬器爬取抖音評論數據的示例代碼

ps:抖音不會一次性返回整個評論數據包,每次往下滑動評論區會多出26條評論數據,我們就可以利用模擬器進行滑動操作。

點擊 更多>鼠標宏

python實現模擬器爬取抖音評論數據的示例代碼

點擊錄屏之后,用鼠標往下滑動一次頁面

python實現模擬器爬取抖音評論數據的示例代碼

點擊停止,就會將你剛才的操作保存下來

python實現模擬器爬取抖音評論數據的示例代碼

點擊設置 可以對剛才的操作進行循環播放,從而達到自動刷新評論區。

python實現模擬器爬取抖音評論數據的示例代碼

到此這篇關于python實現模擬器爬取抖音評論數據的示例代碼的文章就介紹到這了,更多相關python 擬器爬取數據內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: 抖音 Python
相關文章:
主站蜘蛛池模板: 气胀轴|气涨轴|安全夹头|安全卡盘|伺服纠偏系统厂家-天机传动 | 垃圾压缩设备_垃圾处理设备_智能移动式垃圾压缩设备--山东明莱环保设备有限公司 | 山东led显示屏,山东led全彩显示屏,山东LED小间距屏,临沂全彩电子屏-山东亚泰视讯传媒有限公司 | 挨踢网-大家的导航! | CCE素质教育博览会 | CCE素博会 | 教育展 | 美育展 | 科教展 | 素质教育展 | 石英陶瓷,石英坩埚,二氧化硅陶瓷-淄博百特高新材料有限公司 | 欧必特空气能-商用空气能热水工程,空气能热水器,超低温空气源热泵生产厂家-湖南欧必特空气能公司 | 电车线(用于供电给电车的输电线路)-百科| 流程管理|流程管理软件|企业流程管理|微宏科技-AlphaFlow_流程管理系统软件服务商 | 安徽千住锡膏_安徽阿尔法锡膏锡条_安徽唯特偶锡膏_卡夫特胶水-芜湖荣亮电子科技有限公司 | 微型气象仪_气象传感器_防爆气象传感器-天合传感器大全 | 成人纸尿裤,成人尿不湿,成人护理垫-山东康舜日用品有限公司 | 智能化的检漏仪_气密性测试仪_流量测试仪_流阻阻力测试仪_呼吸管快速检漏仪_连接器防水测试仪_车载镜头测试仪_奥图自动化科技 | 锯边机,自动锯边机,双面涂胶机-建业顺达机械有限公司 | ISO9001认证咨询_iso9001企业认证代理机构_14001|18001|16949|50430认证-艾世欧认证网 | 威廉希尔WilliamHill·足球(中国)体育官方网站 | 南溪在线-南溪招聘找工作、找房子、找对象,南溪综合生活信息门户! | 小程序开发公司-小程序制作-微信小程序开发-小程序定制-咏熠软件 | 翰墨AI智能写作助手官网_人工智能问答在线AI写作免费一键生成 | 湖南印刷厂|长沙印刷公司|画册印刷|挂历印刷|台历印刷|杂志印刷-乐成印刷 | 智成电子深圳tdk一级代理-提供TDK电容电感贴片蜂鸣器磁芯lambda电源代理经销,TDK代理商有哪些TDK一级代理商排名查询。-深圳tdk一级代理 | 硅胶布|电磁炉垫片|特氟龙胶带-江苏浩天复合材料有限公司 | 螺杆真空泵_耐腐蚀螺杆真空泵_水环真空泵_真空机组_烟台真空泵-烟台斯凯威真空 | 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛调查出轨取证公司_青岛婚外情取证-青岛探真调查事务所 | MES系统-WMS系统-MES定制开发-制造执行MES解决方案-罗浮云计算 | 包装机传感器-搅拌站传感器-山东称重传感器厂家-济南泰钦电气 | 压砖机_电动螺旋压力机_粉末成型压力机_郑州华隆机械tel_0371-60121717 | 佛山市钱丰金属不锈钢蜂窝板定制厂家|不锈钢装饰线条|不锈钢屏风| 电梯装饰板|不锈钢蜂窝板不锈钢工艺板材厂家佛山市钱丰金属制品有限公司 | 全屋整木定制-橱柜,家具定制-四川峨眉山龙马木业有限公司 | 网优资讯-为循环资源、大宗商品、工业服务提供资讯与行情分析的数据服务平台 | 窖井盖锯圆机_锯圆机金刚石锯片-无锡茂达金刚石有限公司 | 珠海白蚁防治_珠海灭鼠_珠海杀虫灭鼠_珠海灭蟑螂_珠海酒店消杀_珠海工厂杀虫灭鼠_立净虫控防治服务有限公司 | Safety light curtain|Belt Sway Switches|Pull Rope Switch|ultrasonic flaw detector-Shandong Zhuoxin Machinery Co., Ltd | 热回收盐水机组-反应釜冷水机组-高低温冷水机组-北京蓝海神骏科技有限公司 | 亳州网络公司 - 亳州网站制作 - 亳州网站建设 - 亳州易天科技 | 苏州西朗门业-欧盟CE|莱茵UL双认证的快速卷帘门品牌厂家 | 医养体检包_公卫随访箱_慢病随访包_家签随访包_随访一体机-济南易享医疗科技有限公司 | 烟气在线监测系统_烟气在线监测仪_扬尘检测仪_空气质量监测站「山东风途物联网」 | 仿古瓦,仿古金属瓦,铝瓦,铜瓦,铝合金瓦-西安东申景观艺术工程有限公司 | 合肥仿石砖_合肥pc砖厂家_合肥PC仿石砖_安徽旭坤建材有限公司 | 上海logo设计 |