电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

python pandas,DF.groupby()。agg(),agg()中的列引用

瀏覽:2日期:2022-08-07 13:10:43
如何解決python pandas,DF.groupby()。agg(),agg()中的列引用?

agg與相同aggregate。可調用的是一次傳遞一次的列(Series對象)DataFrame。

您可以idxmax用來收集具有最大計數的行的索引標簽:

idx = df.groupby(’word’)[’count’].idxmax()print(idx)

產量

worda 2an 3the 1Name: count

然后用于loc在word和tag列中選擇那些行:

print(df.loc[idx, [’word’, ’tag’]])

產量

word tag2 a T3 an T1 the S

請注意,idxmax返回索引 標簽。df.loc可用于按標簽選擇行。但是,如果索引不是唯一的-即,如果存在帶有重復索引標簽的行-df.loc則將選擇帶有標簽的所有行idx。所以,要小心,df.index.is_unique是True如果你使用idxmax與df.loc

或者,您可以使用apply。apply的callable傳遞了一個sub-DataFrame,它使您可以訪問所有列:

import pandas as pddf = pd.DataFrame({’word’:’a the a an the’.split(), ’tag’: list(’sstTT’), ’count’: [30, 20, 60, 5, 10]})print(df.groupby(’word’).apply(lambda subf: subf[’tag’][subf[’count’].idxmax()]))

產量

worda Tan Tthe S

使用idxmax和loc通常比快apply,尤其是對于大型DataFrame。使用IPython的%timeit:

N = 10000df = pd.DataFrame({’word’:’a the a an the’.split()*N, ’tag’: list(’sstTT’)*N, ’count’: [30, 20, 60, 5, 10]*N})def using_apply(df): return (df.groupby(’word’).apply(lambda subf: subf[’tag’][subf[’count’].idxmax()]))def using_idxmax_loc(df): idx = df.groupby(’word’)[’count’].idxmax() return df.loc[idx, [’word’, ’tag’]]In [22]: %timeit using_apply(df)100 loops, best of 3: 7.68 ms per loopIn [23]: %timeit using_idxmax_loc(df)100 loops, best of 3: 5.43 ms per loop

如果你想有一個字典映射字標簽,那么你可以使用set_index 和to_dict這樣的:

In [36]: df2 = df.loc[idx, [’word’, ’tag’]].set_index(’word’)In [37]: df2Out[37]: tagword a Tan Tthe SIn [38]: df2.to_dict()[’tag’]Out[38]: {’a’: ’T’, ’an’: ’T’, ’the’: ’S’}解決方法

關于一個具體問題,說我有一個DataFrame DF

word tag count0 a S 301 the S 202 a T 603 an T 54 the T 10

我想 為每個“單詞” 找到 具有最多“計數”的“標簽” 。因此,回報將類似于

word tag count1 the S 202 a T 603 an T 5

我不在乎計數列或訂單/索引是原始的還是混亂的。返回字典{ ‘the’:’S’ ,…}很好。

我希望我能做

DF.groupby([’word’]).agg(lambda x: x[’tag’][ x[’count’].argmax() ] )

但這不起作用。我無法訪問列信息。

更抽象地講, agg( function 中的 函數 將其視為 __什么?

順便說一句,.agg()與.aggregate()相同嗎?

非常感謝。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 施工电梯_齿条货梯_烟囱电梯_物料提升机-河南大诚机械制造有限公司 | 两头忙,井下装载机,伸缩臂装载机,30装载机/铲车,50装载机/铲车厂家_价格-莱州巨浪机械有限公司 | 真空泵厂家_真空泵机组_水环泵_旋片泵_罗茨泵_耐腐蚀防爆_中德制泵 | 考勤系统_考勤管理系统_网络考勤软件_政企|集团|工厂复杂考勤工时统计排班管理系统_天时考勤 | 浙江自考_浙江自学考试网| 检验科改造施工_DSA手术室净化_导管室装修_成都特殊科室建设厂家_医疗净化工程公司_四川华锐 | 电动打包机_气动打包机_钢带捆扎机_废纸打包机_手动捆扎机 | 钢绞线万能材料试验机-全自动恒应力两用机-混凝土恒应力压力试验机-北京科达京威科技发展有限公司 | 南京雕塑制作厂家-不锈钢雕塑制作-玻璃钢雕塑制作-先登雕塑厂 | 上海冠顶工业设备有限公司-隧道炉,烘箱,UV固化机,涂装设备,高温炉,工业机器人生产厂家 | 安徽控制器-合肥船用空调控制器-合肥家电控制器-合肥迅驰电子厂 安徽净化板_合肥岩棉板厂家_玻镁板厂家_安徽科艺美洁净科技有限公司 | 广西教师资格网-广西教师资格证考试网 | 深圳市索富通实业有限公司-可燃气体报警器 | 可燃气体探测器 | 气体检测仪 | 短信通106短信接口验证码接口群发平台_国际短信接口验证码接口群发平台-速度网络有限公司 | 一技任务网_有一技之长,就来技术任务网 | 德国进口电锅炉_商用电热水器_壁挂炉_电采暖器_电热锅炉[德国宝] | 游泳池设备安装工程_恒温泳池设备_儿童游泳池设备厂家_游泳池水处理设备-东莞市君达泳池设备有限公司 | 激光内雕_led玻璃_发光玻璃_内雕玻璃_导光玻璃-石家庄明晨三维科技有限公司 激光内雕-内雕玻璃-发光玻璃 | 齿轮减速马达一体式_蜗轮蜗杆减速机配电机-德国BOSERL齿轮减速电动机生产厂家 | 天津市能谱科技有限公司-专业的红外光谱仪_红外测油仪_紫外测油仪_红外制样附件_傅里叶红外光谱技术生产服务厂商 | 天一线缆邯郸有限公司_煤矿用电缆厂家_矿用光缆厂家_矿用控制电缆_矿用通信电缆-天一线缆邯郸有限公司 | 美侍宠物-专注宠物狗及宠物猫训练|喂养|医疗|繁育|品种|价格 | 烘箱-工业烘箱-工业电炉-实验室干燥箱 - 苏州华洁烘箱制造有限公司 | 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库-首页-东莞市傲马网络科技有限公司 | 泉州陶瓷pc砖_园林景观砖厂家_石英砖地铺石价格 _福建暴风石英砖 | 磁力抛光机_磁力研磨机_磁力去毛刺机-冠古设备厂家|维修|租赁【官网】 | 常州企业采购平台_常州MRO采购公司_常州米孚机电设备有限公司 | 附着力促进剂-尼龙处理剂-PP处理剂-金属附着力处理剂-东莞市炅盛塑胶科技有限公司 | 中视电广_短视频拍摄_短视频推广_短视频代运营_宣传片拍摄_影视广告制作_中视电广 | 蒸压釜-陶粒板隔墙板蒸压釜-山东鑫泰鑫智能装备有限公司 | 云南标线|昆明划线|道路标线|交通标线-就选云南云路施工公司-云南云路科技有限公司 | 聚氨酯催化剂K15,延迟催化剂SA-1,叔胺延迟催化剂,DBU,二甲基哌嗪,催化剂TMR-2,-聚氨酯催化剂生产厂家 | 拉力机-拉力试验机-万能试验机-电子拉力机-拉伸试验机-剥离强度试验机-苏州皖仪实验仪器有限公司 | 工业车间焊接-整体|集中除尘设备-激光|等离子切割机配套除尘-粉尘烟尘净化治理厂家-山东美蓝环保科技有限公司 | 安徽合肥格力空调专卖店_格力中央空调_格力空调总经销公司代理-皖格制冷设备 | 都江堰招聘网-都江堰人才网 都江堰人事人才网 都江堰人才招聘网 邢台人才网_邢台招聘网_邢台123招聘【智达人才网】 | 阿米巴企业经营-阿米巴咨询管理-阿米巴企业培训-广东键锋企业管理咨询有限公司 | 活性炭-果壳木质煤质柱状粉状蜂窝活性炭厂家价格多少钱 | 锂电叉车,电动叉车_厂家-山东博峻智能科技有限公司 | 精密冲床,高速冲床等冲压设备生产商-常州晋志德压力机厂 | 钢衬四氟管道_钢衬四氟直管_聚四氟乙烯衬里管件_聚四氟乙烯衬里管道-沧州汇霖管道科技有限公司 |