电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Python機器學習三大件之二pandas

瀏覽:2日期:2022-06-20 09:07:40
一、Pandas

2008年WesMcKinney開發出的庫

專門用于數據挖掘的開源python庫

以Numpy為基礎,借力Numpy模塊在計算方面性能高的優勢

基于matplotlib,能夠簡便的畫圖

獨特的數據結構

二、數據結構 Pandas中一共有三種數據結構,分別為:Series、DataFrame和MultiIndex。三、Series

Series是一個類似于一維數組的數據結構,它能夠保存任何類型的數據,比如整數、字符串、浮點數等,主要由一組數據和與之相關的索引兩部分構成。

Python機器學習三大件之二pandas

Series的創建

import pandas as pdpd.Series(np.arange(3))

0 01 12 2dtype: int64

#指定索引pd.Series([6.7,5.6,3,10,2], index=[1,2,3,4,5])

1 6.72 5.63 3.04 10.05 2.0dtype: float64

#通過字典數據創建color_count = pd.Series({’red’:100, ’blue’:200, ’green’: 500, ’yellow’:1000})color_count

blue 200green 500red 100yellow 1000dtype: int64

Series的屬性

color_count.indexcolor_count.values

也可以使用索引來獲取數據:

color_count[2]

100

Series排序

data[‘p_change’].sort_values(ascending=True) # 對值進行排序data[‘p_change’].sort_index() # 對索引進行排序#series排序時,只有一列,不需要參數

四、DataFrame

創建

pd.DataFrame(np.random.randn(2,3))

Python機器學習三大件之二pandas

score = np.random.randint(40, 100, (10, 5))score

array([[92, 55, 78, 50, 50],[71, 76, 50, 48, 96],[45, 84, 78, 51, 68],[81, 91, 56, 54, 76],[86, 66, 77, 67, 95],[46, 86, 56, 61, 99],[46, 95, 44, 46, 56],[80, 50, 45, 65, 57],[41, 93, 90, 41, 97],[65, 83, 57, 57, 40]])

但是這樣的數據形式很難看到存儲的是什么的樣的數據,可讀性比較差!!

# 使用Pandas中的數據結構score_df = pd.DataFrame(score)

Python機器學習三大件之二pandas

DataFrame的屬性

data.shapedata.indexdata.columnsdata.valuesdata.Tdata.head(5)data.tail(5)data.reset_index(keys, drop=True)keys : 列索引名成或者列索引名稱的列表drop : boolean, default True.當做新的索引,刪除原來的列

dataframe基本數據操作

data[‘open’][‘2018-02-27’] # 直接使用行列索引名字的方式(先列后行)data.loc[‘2018-02-27’:‘2018-02-22’, ‘open’] # 使用loc:只能指定行列索引的名字data.iloc[:3, :5 ]# 使用iloc可以通過索引的下標去獲取data.sort_values(by=“open”, ascending=True) #單個排序data.sort_values(by=[‘open’, ‘high’]) # 按照多個鍵進行排序data.sort_index() # 對索引進行排序

DataFrame運算

應用add等實現數據間的加、減法運算應用邏輯運算符號實現數據的邏輯篩選應用isin, query實現數據的篩選使用describe完成綜合統計使用max, min, mean, std完成統計計算使用idxmin、idxmax完成最大值最小值的索引使用cumsum等實現累計分析應用apply函數實現數據的自定義處理

五、pandas.DataFrame.plot

DataFrame.plot(kind=‘line’)kind : str,需要繪制圖形的種類‘line’ : line plot (default)‘bar’ : vertical bar plot‘barh’ : horizontal bar plot關于“barh”的解釋:http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.barh.html‘hist’ : histogram‘pie’ : pie plot‘scatter’ : scatter plot

六、缺失值處理

isnull、notnull判斷是否存在缺失值np.any(pd.isnull(movie)) # 里面如果有一個缺失值,就返回Truenp.all(pd.notnull(movie)) # 里面如果有一個缺失值,就返回Falsedropna刪除np.nan標記的缺失值movie.dropna()fillna填充缺失值movie[i].fillna(value=movie[i].mean(), inplace=True)replace替換wis.replace(to_replace='?', value=np.NaN)

七、數據離散化

p_change= data[’p_change’]# 自行分組,每組個數差不多qcut = pd.qcut(p_change, 10)# 計算分到每個組數據個數qcut.value_counts()

# 自己指定分組區間bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]p_counts = pd.cut(p_change, bins)

得出one-hot編碼矩陣

dummies = pd.get_dummies(p_counts, prefix='rise')#prefix:分組名字前綴八、數據合并

pd.concat([data1, data2], axis=1)按照行或列進行合并,axis=0為列索引,axis=1為行索引

pd.merge(left, right, how=‘inner’, on=None)

可以指定按照兩組數據的共同鍵值對合并或者左右各自left: DataFrameright: 另一個DataFrameon: 指定的共同鍵how:按照什么方式連接

九、交叉表與透視表

交叉表:計算一列數據對于另外一列數據的分組個數 透視表:指定某一列對另一列的關系

#通過交叉表找尋兩列數據的關系count = pd.crosstab(data[’week’], data[’posi_neg’])#通過透視表,將整個過程變成更簡單一些data.pivot_table([’posi_neg’], index=’week’)十、數據聚合

count = starbucks.groupby([’Country’]).count()col.groupby([’color’])[’price1’].mean()#拋開聚合談分組,無意義

到此這篇關于Python機器學習三大件之二pandas的文章就介紹到這了,更多相關Python pandas內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 防爆型气象站_农业气象站_校园气象站_农业四情监测系统「山东万象环境科技有限公司」 | 济南菜鸟驿站广告|青岛快递车车体|社区媒体-抖音|墙体广告-山东揽胜广告传媒有限公司 | 钛板_钛管_钛棒_钛盘管-无锡市盛钛科技有限公司 | 低气压试验箱_高低温低气压试验箱_低气压实验箱 |林频试验设备品牌 | 脱硝喷枪-氨水喷枪-尿素喷枪-河北思凯淋环保科技有限公司 | 同学聚会纪念册制作_毕业相册制作-成都顺时针宣传画册设计公司 | 宏源科技-房地产售楼系统|线上开盘系统|售楼管理系统|线上开盘软件 | 粤丰硕水性环氧地坪漆-防静电自流平厂家-环保地坪涂料代理 | 北京乾茂兴业科技发展有限公司 | 光栅尺_Magnescale探规_磁栅尺_笔式位移传感器_苏州德美达 | 无线遥控更衣吊篮_IC卡更衣吊篮_电动更衣吊篮配件_煤矿更衣吊篮-力得电子 | 纯水设备_苏州皙全超纯水设备水处理设备生产厂家 | Magnescale探规,Magnescale磁栅尺,Magnescale传感器,Magnescale测厚仪,Mitutoyo光栅尺,笔式位移传感器-苏州连达精密量仪有限公司 | 熔体泵|换网器|熔体齿轮泵|熔体计量泵厂家-郑州巴特熔体泵有限公司 | 企业管理培训,企业培训公开课,企业内训课程,企业培训师 - 名课堂企业管理培训网 | 膏剂灌装旋盖机-眼药水灌装生产线-西林瓶粉剂分装机-南通博琅机械科技 | 超声波_清洗机_超声波清洗机专业生产厂家-深圳市好顺超声设备有限公司 | 北京环球北美考试院【官方网站】|北京托福培训班|北京托福培训 | 罗氏牛血清白蛋白,罗氏己糖激酶-上海嵘崴达实业有限公司 | 亳州网络公司 - 亳州网站制作 - 亳州网站建设 - 亳州易天科技 | 【法利莱住人集装箱厂家】—活动集装箱房,集装箱租赁_大品牌,更放心 | 游戏版号转让_游戏资质出售_游戏公司转让-【八九买卖网】 | 千斤顶,液压千斤顶-力良企业,专业的液压千斤顶制造商,shliliang.com | 洗地机_全自动洗地机_手推式洗地机【上海滢皓环保】 | 北京宣传片拍摄_产品宣传片拍摄_宣传片制作公司-现像传媒 | 冻干机(冷冻干燥机)_小型|实验型|食品真空冷冻干燥机-松源 | 玉米深加工设备|玉米加工机械|玉米加工设备|玉米深加工机械-河南成立粮油机械有限公司 | 盘煤仪,盘料仪,盘点仪,堆料测量仪,便携式激光盘煤仪-中科航宇(北京)自动化工程技术有限公司 | 超声骨密度仪-骨密度检测仪-经颅多普勒-tcd仪_南京科进实业有限公司 | 灌木树苗-绿化苗木-常绿乔木-价格/批发/基地 - 四川成都途美园林 | 密度电子天平-内校-外校电子天平-沈阳龙腾电子有限公司 | 自动化展_机器人展_机床展_工业互联网展_广东佛山工博会 | FFU_空气初效|中效|高效过滤器_空调过滤网-广州梓净净化设备有限公司 | 电缆接头-防爆电缆接头-格兰头-金属电缆接头-防爆填料函 | 真空冷冻干燥机_国产冻干机_冷冻干燥机_北京四环冻干 | 汽车水泵_汽车水泵厂家-瑞安市骏迪汽车配件有限公司 | 优考试_免费在线考试系统_培训考试系统_题库系统_组卷答题系统_匡优考试 | 除尘布袋_液体过滤袋_针刺毡滤料-杭州辉龙过滤技术有限公司 | 悬浮拼装地板_幼儿园_篮球场_悬浮拼接地板-山东悬浮拼装地板厂家 | 国际线缆连接网 - 连接器_线缆线束加工行业门户网站 | 食品无尘净化车间,食品罐装净化车间,净化车间配套风淋室-青岛旭恒洁净技术有限公司 |