电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

如何提高python 中for循環的效率

瀏覽:5日期:2022-07-30 09:04:14

對于某個城市的出租車數據,一天就有33210000條記錄,如何將每輛車的數據單獨拎出來放到一個專屬的文件中呢?

思路很簡單:

就是循環33210000條記錄,將每輛車的數據搬運到它該去的文件中。

但是對于3000多萬條數據,一個一個循環太消耗時間,我花了2個小時才搬運了60萬數據,算算3000萬我需要花費100個小時,也就需要4-5天。并且還需要保證這五天全天開機,不能出現卡機的事故。

因此,需要使用并行進行for循環的技巧:

由于3000萬數據放到csv中導致csv打不開,因此我就把一個csv通過split軟件將其切分成每份60萬,共53個csv。

我原來的思路是讀取文件夾,獲取由每一個60萬的csv文件組成的列表,再分別對每一個60萬的csv進行處理。實質上還是循環33210000次,并行for循環就是同時處理幾個60萬的csv文件,就能成倍的減少時間消耗。

并行進行for循環是受下面的方法啟發:

我之前的做法類似這樣:

words = [’apple’, ’bananan’, ’cake’, ’dumpling’] for word in words: print word

并行for循環類似這樣:

from multiprocessing.dummy import Pool as ThreadPoolitems = list()pool = ThreadPool()pool.map(process, items)pool.close()pool.join()

其中,process是進行處理的函數

實例代碼如下:

# -*- coding: utf-8 -*-import timefrom multiprocessing.dummy import Pool as ThreadPooldef process(item): print(’正在并行for循環’) print(item) time.sleep(5)items = [’apple’, ’bananan’, ’cake’, ’dumpling’]pool = ThreadPool()pool.map(process, items)pool.close()pool.join()

補充知識:Python3用多線程替代for循環提升程序運行速度

優化前后新老代碼如下:

from git_tools.git_tool import get_collect_projects, QQNews_Gitfrom threading import Thread, Lockimport datetimebase_url = 'http://git.xx.com'project_members_commits_lang_info = {}lock = Lock()threads = []’’’Author:zenkilan’’’def count_time(func): def took_up_time(*args, **kwargs): start_time = datetime.datetime.now() ret = func(*args, **kwargs) end_time = datetime.datetime.now() took_up_time = (end_time - start_time).total_seconds() print(f'{func.__name__} execution took up time:{took_up_time}') return ret return took_up_timedef get_project_member_lang_code_lines(git, member, begin_date, end_date): global project_members_commits_lang_info global lock member_name = member['username'] r = git.get_user_info(member_name) if not r['id']: return user_commits_lang_info = git.get_commits_user_lang_diff_between(r['id'], begin_date, end_date) if len(user_commits_lang_info) == 0: return lock.acquire() project_members_commits_lang_info.setdefault(git.project, dict()) project_members_commits_lang_info[git.project][member_name] = user_commits_lang_info lock.release()def get_project_lang_code_lines(project, begin_date, end_date): global threads git = QQNews_Git(project[1], base_url, project[0]) project_members = git.get_project_members() if len(project_members) == 0: return for member in project_members: thread = Thread(target=get_project_member_lang_code_lines, args=(git, member, begin_date, end_date)) threads.append(thread) thread.start()@count_timedef get_projects_lang_code_lines(begin_date, end_date): ''' 獲取項目代碼行語言相關統計——新方法(提升效率) 應用多線程替代for循環 并發訪問共享外部資源 :return: ''' global project_members_commits_lang_info global threads for project in get_collect_projects(): thread = Thread(target=get_project_lang_code_lines, args=(project, begin_date, end_date)) threads.append(thread) thread.start()@count_timedef get_projects_lang_code_lines_old(begin_date, end_date): ''' 獲取項目代碼行語言相關統計——老方法(耗時嚴重) 使用最基本的思路進行編程 雙層for循環嵌套并且每層都包含耗時操作 :return: ''' project_members_commits_lang_info = {} for project in get_collect_projects(): git = QQNews_Git(project[1], base_url, project[0]) project_members = git.get_project_members() user_commits_lang_info_dict = {} if len(project_members) == 0: continue for member in project_members: member_name = member['username'] r = git.get_user_info(member_name, debug=False) if not r['id']:continue try:user_commits_lang_info = git.get_commits_user_lang_diff_between(r['id'], begin_date, end_date)if len(user_commits_lang_info) == 0: continueuser_commits_lang_info_dict[member_name] = user_commits_lang_infoproject_members_commits_lang_info[git.project] = user_commits_lang_info_dict except:pass return project_members_commits_lang_infodef test_results_equal(resultA, resultB): ''' 測試方法 :param resultA: :param resultB: :return: ''' print(resultA) print(resultB) assert len(str(resultA)) == len(str(resultB))if __name__ == ’__main__’: from git_tools.config import begin_date, end_date get_projects_lang_code_lines(begin_date, end_date) for t in threads: t.join() old_result = get_projects_lang_code_lines_old(begin_date, end_date) test_results_equal(old_result, project_members_commits_lang_info)

老方法里外層for循環和內層for循環里均存在耗時操作:

1)git.get_project_members()

2)git.get_user_info(member_name, debug=False)

分兩步來優化,先里后外或先外后里都行。用多線程替換for循環,并發共享外部資源,加鎖避免寫沖突。

測試結果通過,函數運行時間裝飾器顯示(單位秒):

get_projects_lang_code_lines execution took up time:1.85294

get_projects_lang_code_lines_old execution took up time:108.604177

速度提升了約58倍

以上這篇如何提高python 中for循環的效率就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 北京翻译公司_同传翻译_字幕翻译_合同翻译_英语陪同翻译_影视翻译_翻译盖章-译铭信息 | 商标转让-购买商标专业|放心的商标交易网-蜀易标商标网 | 铁艺,仿竹,竹节,护栏,围栏,篱笆,栅栏,栏杆,护栏网,网围栏,厂家 - 河北稳重金属丝网制品有限公司 山东太阳能路灯厂家-庭院灯生产厂家-济南晟启灯饰有限公司 | elisa试剂盒价格-酶联免疫试剂盒-猪elisa试剂盒-上海恒远生物科技有限公司 | 仿清水混凝土_清水混凝土装修_施工_修饰_保护剂_修补_清水混凝土修复-德州忠岭建筑装饰工程 | 磁力抛光机_磁力研磨机_磁力去毛刺机-冠古设备厂家|维修|租赁【官网】 | 【铜排折弯机,钢丝折弯成型机,汽车发泡钢丝折弯机,线材折弯机厂家,线材成型机,铁线折弯机】贝朗折弯机厂家_东莞市贝朗自动化设备有限公司 | 东风体检车厂家_公共卫生体检车_医院体检车_移动体检车-锦沅科贸 | 短信营销平台_短信群发平台_106短信发送平台-河南路尚 | 天津力值检测-天津管道检测-天津天诚工程检测技术有限公司 | 托盘租赁_塑料托盘租赁_托盘出租_栈板出租_青岛托盘租赁-优胜必达 | 数字展示在线_数字展示行业门户网站 | 轻型地埋电缆故障测试仪,频响法绕组变形测试仪,静荷式卧式拉力试验机-扬州苏电 | PSI渗透压仪,TPS酸度计,美国CHAI PCR仪,渗透压仪厂家_价格,微生物快速检测仪-华泰和合(北京)商贸有限公司 | 正压送风机-多叶送风口-板式排烟口-德州志诺通风设备 | 模具硅橡胶,人体硅胶,移印硅胶浆厂家-宏图硅胶科技 | 低噪声电流前置放大器-SR570电流前置放大器-深圳市嘉士达精密仪器有限公司 | 筒瓦厂家-仿古瓦-寺庙-古建琉璃瓦-宜兴市古典园林建筑陶瓷厂有限公司 | 粘度计NDJ-5S,粘度计NDJ-8S,越平水分测定仪-上海右一仪器有限公司 | 切铝机-数控切割机-型材切割机-铝型材切割机-【昆山邓氏精密机械有限公司】 | 卫生人才网-中国专业的医疗卫生医学人才网招聘网站! | 常州翔天实验仪器厂-恒温振荡器-台式恒温振荡器-微量血液离心机 恒温恒湿箱(药品/保健品/食品/半导体/细菌)-兰贝石(北京)科技有限公司 | Trimos测长机_测高仪_TESA_mahr,WYLER水平仪,PWB对刀仪-德瑞华测量技术(苏州)有限公司 | 河南卓美创业科技有限公司-河南卓美防雷公司-防雷接地-防雷工程-重庆避雷针-避雷器-防雷检测-避雷带-避雷针-避雷塔、机房防雷、古建筑防雷等-山西防雷公司 | 碳化硅,氮化硅,冰晶石,绢云母,氟化铝,白刚玉,棕刚玉,石墨,铝粉,铁粉,金属硅粉,金属铝粉,氧化铝粉,硅微粉,蓝晶石,红柱石,莫来石,粉煤灰,三聚磷酸钠,六偏磷酸钠,硫酸镁-皓泉新材料 | 耐酸泵,耐腐蚀真空泵,耐酸真空泵-淄博华舜耐腐蚀真空泵有限公司 精密模具-双色注塑模具加工-深圳铭洋宇通 | 诸城网站建设-网络推广-网站优化-阿里巴巴托管-诸城恒泰互联 | 课件导航网_ppt课件_课件模板_课件下载_最新课件资源分享发布平台 | 铁素体测量仪/检测仪/铁素体含量测试仪-苏州圣光仪器有限公司 | 锂辉石检测仪器,水泥成分快速分析仪-湘潭宇科分析仪器有限公司 | 玻璃钢罐_玻璃钢储罐_盐酸罐厂家-河北华盛节能设备有限公司 | 浙江红酒库-冰雕库-气调库-茶叶库安装-医药疫苗冷库-食品物流恒温恒湿车间-杭州领顺实业有限公司 | 防爆电机_ybx3系列电机_河南省南洋防爆电机有限公司 | 高速混合机_锂电混合机_VC高效混合机-无锡鑫海干燥粉体设备有限公司 | 智能风向风速仪,风速告警仪,数字温湿仪,综合气象仪(气象五要素)-上海风云气象仪器有限公司 | 工业冷却塔维修厂家_方形不锈钢工业凉水塔维修改造方案-广东康明节能空调有限公司 | 手术室净化厂家_成都实验室装修公司_无尘车间施工单位_洁净室工程建设团队-四川华锐16年行业经验 | 二氧化碳/活性炭投加系统,次氯酸钠发生器,紫外线消毒设备|广州新奥 | 快干水泥|桥梁伸缩缝止水胶|伸缩缝装置生产厂家-广东广航交通科技有限公司 | 家用净水器代理批发加盟_净水机招商代理_全屋净水器定制品牌_【劳伦斯官网】 | 铝机箱_铝外壳加工_铝外壳厂家_CNC散热器加工-惠州市铂源五金制品有限公司 |