电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Python 數據分析之逐塊讀取文本的實現

瀏覽:6日期:2022-07-02 11:00:12
背景

《利用Python進行數據分析》,第 6 章的數據加載操作 read_xxx,有 chunksize 參數可以進行逐塊加載。

經測試,它的本質就是將文本分成若干塊,每次處理 chunksize 行的數據,最終返回一個TextParser 對象,對該對象進行迭代遍歷,可以完成逐塊統計的合并處理。

示例代碼

文中的示例代碼分析如下:

from pandas import DataFrame,Seriesimport pandas as pd path=’D:/AStudy2018/pydata-book-2nd-edition/examples/ex6.csv’# chunksize return TextParserchunker=pd.read_csv(path,chunksize=1000) # an array of Seriestot=Series([])chunkercount=0for piece in chunker:print ’------------piece[key] value_counts start-----------’#piece is a DataFrame,lenth is chunksize=1000,and piece[key] is a Series ,key is int ,value is the key columnprint piece[’key’].value_counts()print ’------------piece[key] value_counts end-------------’#piece[key] value_counts is a Series ,key is the key column, and value is the key counttot=tot.add(piece[’key’].value_counts(),fill_value=0)chunkercount+=1 #last order the seriestot=tot.order(ascending=False)print chunkercountprint ’--------------’流程分析

首先,例子數據 ex6.csv 文件總共有 10000 行數據,使用 chunksize=1000 后,read_csv操作返回一個 TextParser 對象,該對象總共有10個元素,遍歷過程中打印 chunkercount驗證得到。

其次,每個 piece 對象是一個 DataFrame 對象,piece[’key’] 得到的是一個 Series 對象,默認是數值索引,值為 csv 文件中的 key 列的值,即各個字符串。

將每個 Series 的 value_counts 作為一個Series,與上一次統計的 tot 結果進行 add 操作,最終得到所有塊數據中各個 key 的累加值。

最后,對 tot 進行 order 排序,按降序得到各個 key 的值在 csv 文件中出現的總次數。

這里很巧妙了使用 Series 對象的 add 操作,對兩個 Series 執行 add 操作,即合并相同key:key相同的記錄的值累加,key不存在的記錄設置填充值為0

輸出結果為:

Python 數據分析之逐塊讀取文本的實現

到此這篇關于Python 數據分析之逐塊讀取文本的實現的文章就介紹到這了,更多相關Python 逐塊讀取文本內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 脑钠肽-白介素4|白介素8试剂盒-研域(上海)化学试剂有限公司 | 污泥烘干机-低温干化机-工业污泥烘干设备厂家-焦作市真节能环保设备科技有限公司 | 橡胶膜片,夹布膜片,橡胶隔膜密封,泵阀设备密封膜片-衡水汉丰橡塑科技公司网站 | T恤衫定做,企业文化衫制作订做,广告T恤POLO衫定制厂家[源头工厂]-【汉诚T恤定制网】 | 顶空进样器-吹扫捕集仪-热脱附仪-二次热解吸仪-北京华盛谱信仪器 | 诸城网站建设-网络推广-网站优化-阿里巴巴托管-诸城恒泰互联 | 橡胶弹簧|复合弹簧|橡胶球|振动筛配件-新乡市永鑫橡胶厂 | 旋振筛_不锈钢旋振筛_气旋筛_旋振筛厂家—新乡市大汉振动机械有限公司 | 立式矫直机_卧式矫直机-无锡金矫机械制造有限公司 | 武汉天安盾电子设备有限公司 - 安盾安检,武汉安检门,武汉安检机,武汉金属探测器,武汉测温安检门,武汉X光行李安检机,武汉防爆罐,武汉车底安全检查,武汉液体探测仪,武汉安检防爆设备 | KBX-220倾斜开关|KBW-220P/L跑偏开关|拉绳开关|DHJY-I隔爆打滑开关|溜槽堵塞开关|欠速开关|声光报警器-山东卓信有限公司 | 塑料撕碎机_编织袋撕碎机_废纸撕碎机_生活垃圾撕碎机_废铁破碎机_河南鑫世昌机械制造有限公司 | 不锈钢螺丝 - 六角螺丝厂家 - 不锈钢紧固件 - 万千紧固件--紧固件一站式采购 | 编织人生 - 权威手工编织网站,编织爱好者学习毛衣编织的门户网站,织毛衣就上编织人生网-编织人生 | 上海小程序开发-上海小程序制作公司-上海网站建设-公众号开发运营-软件外包公司-咏熠科技 | 丹佛斯压力传感器,WISE温度传感器,WISE压力开关,丹佛斯温度开关-上海力笙工业设备有限公司 | 集装袋吨袋生产厂家-噸袋廠傢-塑料编织袋-纸塑复合袋-二手吨袋-太空袋-曹县建烨包装 | 可程式恒温恒湿试验箱|恒温恒湿箱|恒温恒湿试验箱|恒温恒湿老化试验箱|高低温试验箱价格报价-广东德瑞检测设备有限公司 | 3dmax渲染-效果图渲染-影视动画渲染-北京快渲科技有限公司 | 高压油管,液压接头,液压附件-烟台市正诚液压附件 | 飞行者联盟-飞机模拟机_无人机_低空经济_航空技术交流平台 | 台式低速离心机-脱泡离心机-菌种摇床-常州市万丰仪器制造有限公司 | 喷播机厂家_二手喷播机租赁_水泥浆洒布机-河南青山绿水机电设备有限公司 | 铝箔袋,铝箔袋厂家,东莞铝箔袋,防静电铝箔袋,防静电屏蔽袋,防静电真空袋,真空袋-东莞铭晋让您的产品与众不同 | 汽液过滤网厂家_安平县银锐丝网有限公司 | 雾度仪_雾度计_透光率雾度仪价格-三恩时(3nh)光电雾度仪厂家 | 板式换网器_柱式换网器_自动换网器-郑州海科熔体泵有限公司 | 学叉车培训|叉车证报名|叉车查询|叉车证怎么考-工程机械培训网 | 软膜天花_软膜灯箱_首选乐创品牌_一站式天花软膜材料供应商! | 营养师网,营养师考试时间,报名入口—网站首页 | 青岛代理记账_青岛李沧代理记账公司_青岛崂山代理记账一个月多少钱_青岛德辉财税事务所官网 | 诸城网站建设-网络推广-网站优化-阿里巴巴托管-诸城恒泰互联 | 耐酸碱胶管_耐腐蚀软管总成_化学品输送软管_漯河利通液压科技耐油耐磨喷砂软管|耐腐蚀化学软管 | 餐饮小吃技术培训-火锅串串香培训「何小胖培训」_成都点石成金[官网] | 防火门|抗爆门|超大门|医疗门|隔声门-上海加汇门业生产厂家 | 植筋胶-粘钢胶-碳纤维布-碳纤维板-环氧砂浆-加固材料生产厂家-上海巧力建筑科技有限公司 | 滚筒烘干机_转筒烘干机_滚筒干燥机_转筒干燥机_回转烘干机_回转干燥机-设备生产厂家 | CNC机加工-数控加工-精密零件加工-ISO认证厂家-鑫创盟 | 激光内雕_led玻璃_发光玻璃_内雕玻璃_导光玻璃-石家庄明晨三维科技有限公司 激光内雕-内雕玻璃-发光玻璃 | 河南膏药贴牌-膏药代加工-膏药oem厂家-洛阳今世康医药科技有限公司 | 家庭教育吧-在线家庭教育平台,专注青少年家庭教育 |