电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

python中pandas.read_csv()函數的深入講解

瀏覽:174日期:2022-06-23 18:54:42

這里將更新最新的最全面的read_csv()函數功能以及參數介紹,參考資料來源于官網。

pandas庫簡介

官方網站里詳細說明了pandas庫的安裝以及使用方法,在這里獲取最新的pandas庫信息,不過官網僅支持英文。

pandas是一個Python包,并且它提供快速,靈活和富有表現力的數據結構。這樣當我們處理'關系'或'標記'的數據(一維和二維數據結構)時既容易又直觀。

pandas是我們運用Python進行實際、真實數據分析的基礎,同時它是建立在NumPy之上的。

csv文件格式簡介

函數介紹

pandas.csv() 函數將逗號分離的值 (csv) 文件讀入數據框架。還支持可選地將文件讀入塊或將其分解。

函數原型

源文件

pandas.read_csv(filepath_or_buffer, sep=, delimiter=None, header=‘infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression=‘infer’, thousands=None, decimal=’.’, lineterminator=None, quotechar=’'’, quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, dialect=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None, storage_options=None

函數參數以及含義

輸入

參數名 功能以及含義 filepath_or_buffer 字符串。任何有效的字符串路徑都可以,網址也行。 sep 字符串,表示分隔符,默認為’,’ .。一個字符及以上都可以,注意如果是轉義字符要加’’ delimiter 字符串,sep的別名,默認None header int或者int列表,默認由推斷出來。這是用于規定列名的行號。 names 類似于數組結構,選擇性使用。這是要使用的列名稱列表,與header共同使用。 index_col 整數或者字符串或者整數/字符串列表。指定用作的行標簽的列。 usecols 列表,可用可不用。功能是返回列的子集。 squeeze 布爾值,默認為False。如果解析的數據僅包含一列,則返回一個Series prefix 字符串,選擇性使用。沒有標題時要添加到列號的前綴 mangle_dupe_cols 布爾值,默認為True。重復的列將被指定為“ X”,“ X.1”,……“ X.N”,而不是“ X”……“ X”。如果列中的名稱重復,則False將導致數據被覆蓋。 dtype 類型名稱或者類型列的字典,選擇性使用。數據或列的數據類型。 engine {‘c’, ‘python’},選擇性使用。要使用的解析器引擎。C引擎速度更快,而python引擎當前功能更完善。 converters 字典,選擇性使用。轉換器,用于轉換某些列中的值的函數的字典。鍵可以是整數或列標簽。 true_value 列表,選擇性使用。視為True的值 false_values 列表,選擇性使用。視為False的值 skipinitialspace 布爾值,默認為False。在定界符后跳過空格。 skiprows 列表或者整數,選擇性使用。在文件開始處要跳過的行號(索引為0)或要跳過的行數(整數)。 skipfooter 整數,默認為0。要跳過的文件底部的行數(不支持engine =‘c’)。 nrows 整數,選擇性使用。要讀取的文件行數。對于讀取大文件很有用。 na_values 標量,字符串,類似列表的字典,選擇性使用。識別為NA / NaN的其他字符串。如果dict通過,則為特定的每列NA值。默認情況下,以下值解釋為NaN:’’,’#N / A’,’#N / AN / A’,’#NA’,’-1.#IND’,’-1.#QNAN’, ‘-NaN’,’-nan’,‘1.#IND’,‘1.#QNAN’,’’,‘N / A’,‘NA’,‘NULL’,‘NaN’,‘n / a’,‘nan’,‘null’。 keep_default_na 布爾值,默認為True。解析數據時是否包括默認的NaN值。 na_filter 布爾值,默認為True。檢測缺失值標記(空字符串和na_values的值)。請注意,如果將na_filter傳遞為False,則將忽略keep_default_na和 na_values參數。 verbose 布爾值,默認為False。指示放置在非數字列中的NA值的數量。 skip_blank_lines 布爾值,默認為True。如果為True,跳過空白行,并且不解釋為NaN值。 parse_dates 布爾值,整數列表,名稱列表,列表或字典的列表。默認為False。功能是解析為時間。 infer_datetimes_format 布爾值,默認為False。如果啟用True和parse_dates,則pandas將嘗試推斷列中日期時間字符串的格式,并且如果可以推斷出日期格式,就會切換到更快的解析它們的方法。 keep_date_col 布爾值,默認為False。如果True和parse_dates指定合并多個列,則保留原始列。 date_parser 函數,選擇性使用。用于將字符串列序列轉換為日期時間實例數組的函數。 dayfirst 布爾值,默認為False。DD / MM格式的日期,國際和歐洲格式。 cache_dates 布爾值,默認為True。如果為True,則使用唯一的轉換日期緩存來應用datetime轉換。 iterator 布爾值,默認為False。返回TextFileReader對象以進行迭代或使用獲取塊 get_chunk()。 chunksize 整數,選擇性使用。返回TextFileReader對象以進行迭代。 compression {‘infer’, ‘gzip’, ‘bz2’, ‘zip’, ‘xz’, None},默認為’infer’。用于對磁盤數據進行即時解壓縮。設置為“無”將不進行解壓縮。 thousands 字符串,選擇性使用。千位分隔符。 decimal 字符串,默認為’.’。識別為小數點的字符(例如,對于歐洲數據,請使用“,”)。 lineterminator 長度為1的字符串,選擇性使用。用于將文件分成幾行的字符。僅對C解析器有效。 quotechar 長度為1的字符串,選擇性使用。用于表示引用項目的開始和結束的字符。 quoting 整數或者csv.QUOTE_* 實例,默認為0。每個csv.QUOTE_*常量的控制字段引用行為。使用QUOTE_MINIMAL(0),QUOTE_ALL(1),QUOTE_NONNUMERIC(2)或QUOTE_NONE(3)中的一種。 doublequote 布爾值,默認為True。如果指定quotechar而未使用引號QUOTE_NONE,則指示是否將一個字段內的兩個連續的quotechar元素解釋為單個quotechar元素。 escapechar 長度為1的字符串,選擇性使用。 一字符字符串,用于轉義其他字符。 comment 字符串,選擇性使用。指示不應分析行的其余部分。如果在一行的開頭找到該行,則將完全忽略該行。此參數必須是單個字符。 encoding 字符串,選擇性使用。讀/寫時用于UTF的編碼(例如’utf-8’)。 dialect 字符串或者csv.Dialect,選擇性使用。如果提供的話,該參數將覆蓋為以下參數的值(默認或不):delimiter, doublequote, escapechar, skipinitialspace, quotechar, and quoting。 error_bad_lines 布爾值,默認為True。 默認情況下,具有太多字段的行(例如,帶有太多逗號的csv行)將引發異常,并且不會返回任何DataFrame。如果為False,則這些“壞行”將從返回的DataFrame中刪除。 warn_bad_lines 布爾值,默認為True。如果error_bad_lines為False,而warn_bad_lines為True,則將為每個“壞行”輸出警告。 delim_whiterspace 布爾值,默認為False。指定是否將空格(例如或)用作分隔符。 low_memory 布爾值,默認為True。在內部對文件進行分塊處理,從而在解析時減少了內存使用。 memory_map 布爾值,默認為False。如果為filepath_or_buffer提供了文件路徑,則將文件對象直接映射到內存中,然后直接從那里訪問數據。使用此選項可以提高性能,因為不再有任何I / O開銷。 float_precision 字符串,選擇性使用。指定C引擎應將哪個轉換器用于浮點值。 storage_option 字典,選擇性使用。解析特殊的URL。如果為該參數提供非fsspec URL,則會引發錯誤。

返回

DataFrame:將逗號分隔值(csv)文件讀取到DataFrame中。

函數使用實例

終端使用范例:

>>>import pandas as pd>>>pd.read_csv(’data.csv’)

代碼行使用范例

#導入pandas庫,并取別名為pdimport pandas as pd#books.csv與項目不在同一文件夾下使用絕對路徑,分隔符為’;’,出錯的行直接跳過,編碼方式使用'latin-1',變量books是DataFrame數據結構books = pd.read_csv(’D:coderpython_programBooks.csv’, sep=’;’, error_bad_lines = False, encoding='latin-1')#查看books的行和列print(books.shape)#查看print(list(books.columns))print(books.head())總結

到此這篇關于python中pandas.read_csv()函數的文章就介紹到這了,更多相關python pandas.read_csv()函數內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 工装定制/做厂家/公司_工装订做/制价格/费用-北京圣达信工装 | 混合气体腐蚀试验箱_盐雾/硫化氢/气体腐蚀试验箱厂家-北京中科博达 | 天津云仓-天津仓储物流-天津云仓一件代发-顺东云仓 | 3d打印服务,3d打印汽车,三维扫描,硅胶复模,手板,快速模具,深圳市精速三维打印科技有限公司 | 不锈钢管件(不锈钢弯头,不锈钢三通,不锈钢大小头),不锈钢法兰「厂家」-浙江志通管阀 | 安徽净化工程设计_无尘净化车间工程_合肥净化实验室_安徽创世环境科技有限公司 | CTAB,表面活性剂1631溴型(十六烷基三甲基溴化铵)-上海升纬化工原料有限公司 | MVR蒸发器厂家-多效蒸发器-工业废水蒸发器厂家-康景辉集团官网 | 润滑脂-高温润滑脂-轴承润滑脂-食品级润滑油-索科润滑油脂厂家 | 首页-浙江橙树网络技术有限公司 石磨面粉机|石磨面粉机械|石磨面粉机组|石磨面粉成套设备-河南成立粮油机械有限公司 | 法兰螺母 - 不锈钢螺母制造厂家 - 万千紧固件--螺母街 | 齿轮减速机_齿轮减速电机-VEMT蜗轮蜗杆减速机马达生产厂家瓦玛特传动瑞环机电 | 聚合氯化铝-碱式氯化铝-聚合硫酸铁-聚氯化铝铁生产厂家多少钱一吨-聚丙烯酰胺价格_河南浩博净水材料有限公司 | 印刷人才网 印刷、包装、造纸,中国80%的印刷企业人才招聘选印刷人才网! | _网名词典_网名大全_qq网名_情侣网名_个性网名 | 钛板_钛管_钛棒_钛盘管-无锡市盛钛科技有限公司 | 锂电池砂磨机|石墨烯砂磨机|碳纳米管砂磨机-常州市奥能达机械设备有限公司 | 石磨面粉机|石磨面粉机械|石磨面粉机组|石磨面粉成套设备-河南成立粮油机械有限公司 | 小青瓦丨古建筑瓦丨青瓦厂家-宜兴市徽派古典建筑材料有限公司 | 广州市哲铭油墨涂料有限公司,水性漆生产研发基地 | 磁力去毛刺机_去毛刺磁力抛光机_磁力光饰机_磁力滚抛机_精密金属零件去毛刺机厂家-冠古科技 | ORP控制器_ORP电极价格-上优泰百科 | 防潮防水通风密闭门源头实力厂家 - 北京酷思帝克门窗 | 济南办公室装修-厂房装修-商铺装修-工装公司-山东鲁工装饰设计 | 济南网站策划设计_自适应网站制作_H5企业网站搭建_济南外贸网站制作公司_锐尚 | 舞台木地板厂家_体育运动木地板_室内篮球馆木地板_实木运动地板厂家_欧氏篮球地板推荐 | 工业车间焊接-整体|集中除尘设备-激光|等离子切割机配套除尘-粉尘烟尘净化治理厂家-山东美蓝环保科技有限公司 | 不锈钢复合板|钛复合板|金属复合板|南钢集团安徽金元素复合材料有限公司-官网 | 户外环保不锈钢垃圾桶_标识标牌制作_园林公园椅厂家_花箱定制-北京汇众环艺 | 北京网络营销推广_百度SEO搜索引擎优化公司_网站排名优化_谷歌SEO - 北京卓立海创信息技术有限公司 | 冷却塔降噪隔音_冷却塔噪声治理_冷却塔噪音处理厂家-广东康明冷却塔降噪厂家 | 2025第九届世界无人机大会 | 河北凯普威医疗器材有限公司,高档轮椅系列,推车系列,座厕椅系列,协步椅系列,拐扙系列,卫浴系列 | 锡膏喷印机-全自动涂覆机厂家-全自动点胶机-视觉点胶机-深圳市博明智控科技有限公司 | 【星耀裂变】_企微SCRM_任务宝_视频号分销裂变_企业微信裂变增长_私域流量_裂变营销 | 东莞动力锂电池保护板_BMS智能软件保护板_锂电池主动均衡保护板-东莞市倡芯电子科技有限公司 | 真丝围巾|真丝丝巾|羊绒围巾|围巾品牌|浙江越缇围巾厂家定制 | HYDAC过滤器,HYDAC滤芯,现货ATOS油泵,ATOS比例阀-东莞市广联自动化科技有限公司 | loft装修,上海嘉定酒店式公寓装修公司—曼城装饰 | 山东石英砂过滤器,除氟过滤器「价格低」-淄博胜达水处理 | 众品地板网-地板品牌招商_地板装修设计_地板门户的首选网络媒体。 |