电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

利用python匯總統(tǒng)計(jì)多張Excel

瀏覽:8日期:2022-07-10 14:10:37

為什么越來越多的非程序員白領(lǐng)都開始學(xué)習(xí) Python ?他們可能并不是想要學(xué)習(xí) Python 去爬取一些網(wǎng)站從而獲得酷酷的成就感,而是工作中遇到好多數(shù)據(jù)分析處理的問題,用 Python 就可以簡(jiǎn)單高效地解決。本文就通過一個(gè)實(shí)際的例子來給大家展示一下 Python 是如何應(yīng)用于實(shí)際工作中高效解決復(fù)雜問題的。

背景

小明就職于一家戶外運(yùn)動(dòng)專營(yíng)公司,他們公司旗下有好多個(gè)品牌,并且涉及到很多細(xì)分的行業(yè)。小明在這家公司任數(shù)據(jù)分析師,平時(shí)都是通過 Excel 來做數(shù)據(jù)分析的。今天老板丟給他一個(gè)任務(wù):下班前篩選出集團(tuán)公司旗下最近一年銷售額前五名的品牌以及銷售額。

對(duì)于 Excel 大佬來說,這不就是分分鐘的事嗎?小明并沒有放在眼里,直到市場(chǎng)部的同事將原始的數(shù)據(jù)文件發(fā)給他,他才意識(shí)到事情并沒有那么簡(jiǎn)單:

利用python匯總統(tǒng)計(jì)多張Excel

這并不是想象中的排序取前五就行了。這總共有90個(gè)文件,按常規(guī)的思路來看,他要么將所有文件的內(nèi)容復(fù)制到一張表中進(jìn)行分類匯總,要么將每張表格進(jìn)行分類匯總,然后再最最終結(jié)果進(jìn)行分類匯總。

想想這工作量,再想想截止時(shí)間,小明撓了撓頭,感覺到要漸漸頭禿。

思路分析

這種體力活,寫程序解決是最輕松的啦。小明這時(shí)候想到了他的程序員好朋友小段,于是他把這個(gè)問題拋給了小段。

小段縷了下他那所剩無幾的頭發(fā),說:so easy,只需要找潘大師即可。

小明說:你搞不定嗎?還要找其他人!

小段苦笑說:不不不,潘大師是 Python 里面一個(gè)處理數(shù)據(jù)的庫(kù),叫 Pandas ,俗稱 潘大師。

小明說:我不管什么大師不大師,就說需要多久搞定。

小段說:給我?guī)追昼妼懗绦?,再跑幾秒鐘就好了?/p>

小明發(fā)過去了膜拜大佬的表情。

小段略微思考了下,整理了一下程序思路:

計(jì)算每張表每一行的銷售額,用“訪客數(shù) * 轉(zhuǎn)化率 * 客單價(jià)”就行。 將每張表格根據(jù)品牌匯總銷售額。 將所有表格的結(jié)果匯總成一張總表 在總表中根據(jù)品牌匯總銷售額并排序

編碼

第零步,讀取 Excel :

import pandas as pddf = pd.read_excel('./tables/' + name)

第一步,計(jì)算每張表格內(nèi)的銷售額:

df[’銷售額’] = df[’訪客數(shù)’] * df[’轉(zhuǎn)化率’] * df[’客單價(jià)’]

第二步,將每張表格根據(jù)品牌匯總銷售額:

df_sum = df.groupby(’品牌’)[’銷售額’].sum().reset_index()

第三步,將所有表格的結(jié)果匯總成一張總表:

result = pd.DataFrame()result = pd.concat([result, df_sum])

第四步,在總表中根據(jù)品牌匯總銷售額并排序:

final = result.groupby(’品牌’)[’銷售額’].sum().reset_index().sort_values(’銷售額’, ascending=False)

最后,我們來看看完整的程序:

import pandas as pdimport osresult = pd.DataFrame()for name in os.listdir('./tables'): try: df = pd.read_excel('./tables/' + name) df[’銷售額’] = df[’訪客數(shù)’] * df[’轉(zhuǎn)化率’] * df[’客單價(jià)’] df_sum = df.groupby(’品牌’)[’銷售額’].sum().reset_index() result = pd.concat([result, df_sum]) except: print(name) passfinal = result.groupby(’品牌’)[’銷售額’].sum().reset_index().sort_values(’銷售額’, ascending=False)pd.set_option(’display.float_format’, lambda x: ’%.2f’ % x)print(final.head())

最后的結(jié)果是這樣的:

品牌 銷售額15 品牌-5 1078060923.628 品牌-17 1064495314.964 品牌-13 1038560274.213 品牌-12 1026115153.0013 品牌-3 1006908609.07

可以看到最終的前五已經(jīng)出來了,整個(gè)程序運(yùn)行起來還是很快的。

幾分鐘之后,小段就把結(jié)果給小明發(fā)過去了,小明感動(dòng)得內(nèi)牛滿面,直呼改天請(qǐng)吃飯,拜師學(xué)藝!

總結(jié)

本文主要是想通過一個(gè)實(shí)際的案例來向大家展示潘大師(Pandas)的魅力,特別是應(yīng)用于這種表格處理,可以說是太方便了。寫過程序的可能都有點(diǎn)熟悉的感覺,這種處理方式有點(diǎn)類似于 SQL 查詢語(yǔ)句。潘大師不僅能使我們的程序處理起來變得更簡(jiǎn)單高效,對(duì)于需要經(jīng)常處理表格的非程序員也是非常友好的,上手起來也比較簡(jiǎn)單。

示例代碼:https://github.com/JustDoPython/python-examples/tree/master/xianhuan/pandasexcel

以上就是利用python匯總統(tǒng)計(jì)多張Excel的詳細(xì)內(nèi)容,更多關(guān)于python匯總統(tǒng)計(jì)多張Excel的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: python
相關(guān)文章:
主站蜘蛛池模板: 耐磨陶瓷管道_除渣器厂家-淄博浩瀚陶瓷科技有限公司 | 净化板-洁净板-净化板价格-净化板生产厂家-山东鸿星新材料科技股份有限公司 | 润滑油加盟_润滑油厂家_润滑油品牌-深圳市沃丹润滑科技有限公司 琉璃瓦-琉璃瓦厂家-安徽盛阳新型建材科技有限公司 | 3D全息投影_地面互动投影_360度立体投影_水幕灯光秀 | 广东银虎 蜂窝块状沸石分子筛-吸附脱硫分子筛-萍乡市捷龙环保科技有限公司 | 沈飞防静电地板__机房地板-深圳市沈飞防静电设备有限公司 | 纳米涂料品牌 防雾抗污纳米陶瓷涂料厂家_虹瓷科技 | 深圳活动策划公司|庆典策划|专业公关活动策划|深圳艺典文化传媒 重庆中专|职高|技校招生-重庆中专招生网 | 大通天成企业资质代办_承装修试电力设施许可证_增值电信业务经营许可证_无人机运营合格证_广播电视节目制作许可证 | 空调风机,低噪声离心式通风机,不锈钢防爆风机,前倾皮带传动风机,后倾空调风机-山东捷风风机有限公司 | 宁波普瑞思邻苯二甲酸盐检测仪,ROHS2.0检测设备,ROHS2.0测试仪厂家 | 一体化预制泵站-一体化提升泵站-一体化泵站厂家-山东康威环保 | 海德莱电力(HYDELEY)-无功补偿元器件生产厂家-二十年专业从事电力电容器 | 食品机械专用传感器-落料放大器-低价接近开关-菲德自控技术(天津)有限公司 | 粉末冶金注射成型厂家|MIM厂家|粉末冶金齿轮|MIM零件-深圳市新泰兴精密科技 | 定制异形重型钢格栅板/钢格板_定做踏步板/排水沟盖板_钢格栅板批发厂家-河北圣墨金属制品有限公司 | BESWICK球阀,BESWICK接头,BURKERT膜片阀,美国SEL继电器-东莞市广联自动化科技有限公司 | 拉曼光谱仪_便携式|激光|显微共焦拉曼光谱仪-北京卓立汉光仪器有限公司 | ★店家乐|服装销售管理软件|服装店收银系统|内衣店鞋店进销存软件|连锁店管理软件|收银软件手机版|会员管理系统-手机版,云版,App | 山东集装箱活动房|济南集装箱活动房-济南利森集装箱有限公司 | 盘装氧量分析仪-防爆壁挂氧化锆分析仪-安徽吉帆仪表有限公司 | 纯化水设备-EDI-制药-实验室-二级反渗透-高纯水|超纯水设备 | 工业设计,人工智能,体验式3D展示的智能技术交流服务平台-纳金网 J.S.Bach 圣巴赫_高端背景音乐系统_官网 | 双齿辊破碎机-大型狼牙破碎机视频-对辊破碎机价格/型号图片-金联机械设备生产厂家 | 防腐储罐_塑料储罐_PE储罐厂家_淄博富邦滚塑防腐设备科技有限公司 | 首页|光催化反应器_平行反应仪_光化学反应仪-北京普林塞斯科技有限公司 | 喷砂机厂家_自动除锈抛丸机价格-成都泰盛吉自动化喷砂设备 | 长沙广告公司|长沙广告制作设计|长沙led灯箱招牌制作找望城湖南锦蓝广告装饰工程有限公司 | 吊篮式|移动式冷热冲击试验箱-二槽冷热冲击试验箱-广东科宝 | 中国产业发展研究网 - 提供行业研究报告 可行性研究报告 投资咨询 市场调研服务 | 小型数控车床-数控车床厂家-双头数控车床| 车充外壳,车载充电器外壳,车载点烟器外壳,点烟器连接头,旅行充充电器外壳,手机充电器外壳,深圳市华科达塑胶五金有限公司 | 广东西屋电气有限公司-广东西屋电气有限公司 | 交变/复合盐雾试验箱-高低温冲击试验箱_安奈设备产品供应杭州/江苏南京/安徽马鞍山合肥等全国各地 | 轴流风机-鼓风机-离心风机-散热风扇-罩极电机,生产厂家-首肯电子 | 旋振筛|圆形摇摆筛|直线振动筛|滚筒筛|压榨机|河南天众机械设备有限公司 | led冷热冲击试验箱_LED高低温冲击试验箱_老化试验箱-爱佩百科 | 脱硫搅拌器厂家-淄博友胜不锈钢搅拌器厂家 | 阻垢剂,反渗透阻垢剂,缓蚀阻垢剂-山东普尼奥水处理科技有限公司 真空粉体取样阀,电动楔式闸阀,电动针型阀-耐苛尔(上海)自动化仪表有限公司 | 带式压滤机_污泥压滤机_污泥脱水机_带式过滤机_带式压滤机厂家-河南恒磊环保设备有限公司 | 茶叶百科网-茶叶知识与茶文化探讨分享平台 | 一氧化氮泄露报警器,二甲苯浓度超标报警器-郑州汇瑞埔电子技术有限公司 |