电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術(shù)文章
文章詳情頁

基于python 等頻分箱qcut問題的解決

瀏覽:134日期:2022-08-04 15:07:14

在python 較新的版本中,pandas.qcut()這個函數(shù)中是有duplicates這個參數(shù)的,它能解決在等頻分箱中遇到的重復(fù)值過多引起報錯的問題;

在比較舊版本的python中,提供一下解決辦法:

import pandas as pd def pct_rank_qcut(series, n): ’’’ series:要分箱的列 n:箱子數(shù) ’’’ edages = pd.series([i/n for i in range(n)] # 轉(zhuǎn)換成百分比 func = lambda x: (edages >= x).argmax() #函數(shù):(edages >= x)返回fasle/true列表中第一次出現(xiàn)true的索引值 return series.rank(pct=1).astype(float).apply(func) #series.rank(pct=1)每個值對應(yīng)的百分位數(shù),最終返回對應(yīng)的組數(shù);rank()函數(shù)傳入的數(shù)據(jù)類型若為object,結(jié)果會有問題,因此進行了astype

補充拓展:Python數(shù)據(jù)離散化:等寬及等頻

在處理數(shù)據(jù)時,我們往往需要將連續(xù)性變量進行離散化,最常用的方式便是等寬離散化,等頻離散化,在此處我們討論離散化的概念,只給出在python中的實現(xiàn)以供參考

1. 等寬離散化

使用pandas中的cut()函數(shù)進行劃分

import numpy as npimport pandas as pd # Discretization: Equal Width ## Datas: Sample * Featuredef Discretization_EqualWidth(K, Datas, FeatureNumber): DisDatas = np.zeros_like(Datas) for i in range(FeatureNumber): DisOneFeature = pd.cut(Datas[:, i], K, labels=range(1, K+1)) DisDatas[:, i] = DisOneFeature return DisDatas

2. 等頻離散化

pandas中有qcut()可以使用,但是邊界易出現(xiàn)重復(fù)值,如果為了刪除重復(fù)值設(shè)置 duplicates=‘drop’,則易出現(xiàn)于分片個數(shù)少于指定個數(shù)的問題,因此在此處不使用qcut()

import numpy as npimport pandas as pd # Discretization: Equal Frequency ## vector: single featuredef Rank_qcut(vector, K): quantile = np.array([float(i) / K for i in range(K + 1)]) # Quantile: K+1 values funBounder = lambda x: (quantile >= x).argmax() return vector.rank(pct=True).apply(funBounder) # Discretization: Equal Frequency ## Datas: Sample * Featuredef Discretization_EqualFrequency(K, Datas, FeatureNumber): DisDatas = np.zeros_like(Datas) w = [float(i) / K for i in range(K + 1)] for i in range(FeatureNumber): DisOneFeature = Rank_qcut(pd.Series(Datas[:, i]), K) #print(DisOneFeature) DisDatas[:, i] = DisOneFeature return DisDatas

以上這篇基于python 等頻分箱qcut問題的解決就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。

標簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 东莞ERP软件_广州云ERP_中山ERP_台湾工厂erp系统-广东顺景软件科技有限公司 | 新材料分散-高速均质搅拌机-超声波分散混合-上海化烁智能设备有限公司 | 高速龙门架厂家_监控杆_多功能灯杆_信号灯杆_锂电池太阳能路灯-鑫世源照明 | 杭州|上海贴标机-百科 | HDPE储罐_厂家-山东九州阿丽贝防腐设备 | 太阳能发电系统-太阳能逆变器,控制器-河北沐天太阳能科技首页 | 最新电影-好看的电视剧大全-朝夕电影网| 诗词大全-古诗名句 - 古诗词赏析| 废水处理-废气处理-工业废水处理-工业废气处理工程-深圳丰绿环保废气处理公司 | 哔咔漫画网页版在线_下载入口访问指引| 广州迈驰新GMP兽药包装机首页_药品包装机_中药散剂包装机 | 除尘布袋_液体过滤袋_针刺毡滤料-杭州辉龙过滤技术有限公司 | 矿用履带式平板车|探水钻机|气动架柱式钻机|架柱式液压回转钻机|履带式钻机-启睿探水钻机厂家 | 平面钻,法兰钻,三维钻-山东兴田阳光智能装备股份有限公司 | 隐形纱窗|防护纱窗|金刚网防盗纱窗|韦柏纱窗|上海青木装潢制品有限公司|纱窗国标起草单位 | 塑料撕碎机_编织袋撕碎机_废纸撕碎机_生活垃圾撕碎机_废铁破碎机_河南鑫世昌机械制造有限公司 | 首页|光催化反应器_平行反应仪_光化学反应仪-北京普林塞斯科技有限公司 | 定制/定做衬衫厂家/公司-衬衫订做/订制价格/费用-北京圣达信 | 安平县鑫川金属丝网制品有限公司,防风抑尘网,单峰防风抑尘,不锈钢防风抑尘网,铝板防风抑尘网,镀铝锌防风抑尘网 | 多功能干燥机,过滤洗涤干燥三合一设备-无锡市张华医药设备有限公司 | 电气控制系统集成商-PLC控制柜变频控制柜-非标自动化定制-电气控制柜成套-NIDEC CT变频器-威肯自动化控制 | 铆钉机|旋铆机|东莞旋铆机厂家|鸿佰专业生产气压/油压/自动铆钉机 | 北京网站建设首页,做网站选【优站网】,专注北京网站建设,北京网站推广,天津网站建设,天津网站推广,小程序,手机APP的开发。 | 申江储气罐厂家,储气罐批发价格,储气罐规格-上海申江压力容器有限公司(厂) | 儿童语言障碍训练-武汉优佳加感统文化发展有限公司 | 解放卡车|出口|济南重汽|报价大全|山东三维商贸有限公司 | 成都网站建设制作_高端网站设计公司「做网站送优化推广」 | 喷砂机厂家_自动喷砂机生产_新瑞自动化喷砂除锈设备 | 乙炔气体报警装置|固定式氯化氢检测仪|河南驰诚电气百科 | 恒温恒湿试验箱厂家-高低温试验箱维修价格_东莞环仪仪器_东莞环仪仪器 | 智能垃圾箱|垃圾房|垃圾分类亭|垃圾分类箱专业生产厂家定做-宿迁市传宇环保设备有限公司 | 广州二手电缆线回收,旧电缆回收,广州铜线回收-广东益福电缆线回收公司 | 大型果蔬切片机-水果冬瓜削皮机-洗菜机切菜机-肇庆市凤翔餐饮设备有限公司 | 科箭WMS仓库管理软件-TMS物流管理系统-科箭SaaS云服务 | 德国GMN轴承,GMN角接触球轴承,GMN单向轴承,GMN油封,GMN非接触式密封 | 厦门ISO认证|厦门ISO9001认证|厦门ISO14001认证|厦门ISO45001认证-艾索咨询专注ISO认证行业 | 手术室净化厂家-成都做医院净化工程的公司-四川华锐-15年特殊科室建设经验 | 电磁铁_推拉电磁铁_机械手电磁吸盘电磁铁厂家-广州思德隆电子公司 | 昆山新莱洁净应用材料股份有限公司-卫生级蝶阀,无菌取样阀,不锈钢隔膜阀,换向阀,离心泵 | NBA直播_NBA直播免费观看直播在线_NBA直播免费高清无插件在线观看-24直播网 | 游泳池设计|设备|配件|药品|吸污机-东莞市太平洋康体设施有限公司 |