电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

使用Python實現將多表分批次從數據庫導出到Excel

瀏覽:2日期:2022-07-25 14:15:56

一、應用場景

為了避免反復的手手工從后臺數據庫導出某些數據表到Excel文件、高效率到多份離線數據。

二、功能事項

支持一次性導出多個數據源表、自動獲取各表的字段名。

支持控制批次的寫入速率。例如:每5000行一個批次寫入到excel。

支持結構相同的表導入到同一個Excel文件。可適用于經過水平切分后的分布式表。

三、主要實現

1、概覽

A[創建類] -->|方法1| B(創建數據庫連接)A[創建類] -->|方法2| C(取查詢結果集)A[創建類] -->|方法3| D(利用句柄寫入Excel)A[創建類] -->|方法4| E(讀取多個源表)

B(創建數據庫連接) -->U(調用示例)C(取查詢結果集) -->U(調用示例)D(利用句柄寫入Excel) -->U(調用示例)E(讀取多個源表) -->U(調用示例)

2、主要方法

首先需要安裝第三方庫pymssql實現對SQLServer的連接訪問,自定義方法__getConn()需要指定如下五個參數:服務器host、登錄用戶名user、登錄密碼pwd、指定的數據庫db、字符編碼charset。連接成功后,通過cursor()獲取游標對象,它將用來執行數據庫腳本,并得到返回結果集和數據總量。

創建數據庫連接和執行SQL的源碼:

def __init__(self,host,user,pwd,db): self.host = host self.user = user self.pwd = pwd self.db = db def __getConn(self): if not self.db: raise(NameError,’沒有設置數據庫信息’) self.conn = pymssql.connect(host=self.host, user=self.user, password=self.pwd, database=self.db, charset=’utf8’) cur = self.conn.cursor() if not cur: raise(NameError,’連接數據庫失敗’) else: return cur

3、方法3中寫入Excel時,注意一定要用到Pandas中的公共句柄ExcelWriter對象writer。當數據被分批多次寫入同一個文件時,如果直接使用to_excel()方法,則前面批次的結果集將會被后續結果覆蓋。增加了這個公共句柄限制后,后面的寫入會累加到前面寫入的數據尾部行,而不是全部覆蓋。

writer = pd.ExcelWriter(file)df_fetch_data[rs_startrow:i*N].to_excel(writer, header=isHeader, index=False, startrow=startRow)

分批次寫入到目標Excel時的另一個要注意的參數是寫入行startrow的設置。每次寫入完成后需要重新指下一批次數據的初始位置值。每個批次的數據會記錄各自的所屬批次信息。

利用關鍵字參數**args 指定多個數據源表和數據庫連接。

def exportToExcel(self, **args): for sourceTB in args[’sourceTB’]:arc_dict = dict( sourceTB = sourceTB, path=args[’path’], startRow=args[’startRow’], isHeader=args[’isHeader’], batch=args[’batch’] ) print(’n當前導出的數據表為:%s’ %(sourceTB)) self.writeToExcel(**arc_dict) return ’success’

四、先用類MSSQL創建對象,再定義關鍵字參數args,最終調用方法導出到文件即完成數據導出。

#!/usr/bin/env python# coding: utf-8# 主要功能:分批次導出大數據量、結構相同的數據表到excel # 導出多個表的數據到各自的文件, # 目前問題:to_excel 雖然設置了分批寫入,但先前的數據會被下一次寫入覆蓋,# 利用Pandas包中的ExcelWriter()方法增加一個公共句柄,在寫入新的數據之時保留原來寫入的數據,等到把所有的數據都寫進去之后關閉這個句柄import pymssql import pandas as pd import datetime import math class MSSQL(object): def __init__(self,host,user,pwd,db): self.host = host self.user = user self.pwd = pwd self.db = db def __getConn(self): if not self.db: raise(NameError,’沒有設置數據庫信息’) self.conn = pymssql.connect(host=self.host, user=self.user, password=self.pwd, database=self.db, charset=’utf8’) cur = self.conn.cursor() if not cur: raise(NameError,’連接數據庫失敗’) else: return cur def executeQuery(self,sql): cur = self.__getConn() cur.execute(sql) # 獲取所有數據集 # fetchall()獲取結果集中的剩下的所有行 # 如果數據量太大,是否需要分批插入 resList, rowcount = cur.fetchall(),cur.rowcount self.conn.close() return (resList, rowcount) # 導出單個數據表到excel def writeToExcel(self,**args): sourceTB = args[’sourceTB’] columns = args.get(’columns’) path=args[’path’] fname=args.get(’fname’) startRow=args[’startRow’] isHeader=args[’isHeader’] N=args[’batch’] # 獲取指定源數據列 if columns is None: columns_select = ’ * ’ else: columns_select = ’,’.join(columns) if fname is None: fname=sourceTB+’_exportData.xlsx’ file = path + fname # 增加一個公共句柄,寫入新數據時,保留原數據 writer = pd.ExcelWriter(file) sql_select = ’select ’+ columns_select + ’ from ’+ sourceTB fetch_data, rowcount = self.executeQuery(sql_select) # print(rowcount) df_fetch_data = pd.DataFrame(fetch_data) # 一共有roucount行數據,每N行一個batch提交寫入到excel times = math.floor(rowcount/N) i = 1 rs_startrow = 0 # 當總數據量 > 每批插入的數據量時 print(i, times) is_while=0 while i <= times: is_while = 1 # 如果是首次,且指定輸入標題,則有標題 if i==1:# isHeader = TruestartRow = 1 else:# isHeader = FalsestartRow+=N # 切片取指定的每個批次的數據行 ,前閉后開 # startrow: 寫入到目標文件的起始行。0表示第1行,1表示第2行。。。 df_fetch_data[’batch’] = ’batch’+str(i) df_fetch_data[rs_startrow:i*N].to_excel(writer, header=isHeader, index=False, startrow=startRow) print(’第’,str(i),’次循環,取源數據第’,rs_startrow,’行至’,i*N,’行’,’寫入到第’,startRow,’行’) print(’第’,str(i),’次寫入數據為:’,df_fetch_data[rs_startrow:i*N]) # 重新指定源數據的讀取起始行 rs_startrow =i * N i+=1 # 寫入文件的開始行數 # 當沒有做任何循環時,仍然從第一行開始寫入 if is_while == 0: startRow = startRow else: startRow+=N df_fetch_data[’batch’] = ’batch’+str(i) print(’第{0}次讀取數據,從第{1}行開始,寫入到第{2}行!’.format(str(i), str(rs_startrow), str(startRow))) print(’第’,str(i),’寫入數據為:’,df_fetch_data[rs_startrow:i*N]) df_fetch_data[rs_startrow:i*N].to_excel(writer, header=isHeader, index=False, startrow=startRow) # 注: 這里一定要saver()將數據從緩存寫入磁盤!!!!!!!!!!!!!!!!!!!!!1 writer.save() start_time=datetime.datetime.now() # 導出結構相同的多個表到同一樣excel def exportToExcel(self, **args): for sourceTB in args[’sourceTB’]: arc_dict = dict(sourceTB = sourceTB,path=args[’path’],startRow=args[’startRow’],isHeader=args[’isHeader’],batch=args[’batch’] ) print(’n當前導出的數據表為:%s’ %(sourceTB)) self.writeToExcel(**arc_dict) return ’success’ start_time=datetime.datetime.now() if __name__ == '__main__': ms = MSSQL(host='localhost',user='test',pwd='test',db='db_jun') args = dict( sourceTB = [’tb2’, ’tb1’],# 待導出的表 path=’D:myPCPython’,# 導出到指定路徑 startRow=1,#設定寫入文件的首行,第2行為數據首行 isHeader=False,# 是否包含源數據的標題 batch=5 ) # 導出多個文件 ms.exportToExcel(**args)

以上這篇使用Python實現將多表分批次從數據庫導出到Excel就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持好吧啦網。

標簽: python
相關文章:
主站蜘蛛池模板: 东莞注册公司-代办营业执照-东莞公司注册代理记账-极刻财税 | 通风气楼_通风天窗_屋顶风机-山东美创通风设备有限公司 | 仓储笼_仓储货架_南京货架_仓储货架厂家_南京货架价格低-南京一品仓储设备制造公司 | 直齿驱动-新型回转驱动和回转支承解决方案提供商-不二传动 | 专注提供国外机电设备及配件-工业控制领域一站式服务商-深圳市华联欧国际贸易有限公司 | 意大利Frascold/富士豪压缩机_富士豪半封闭压缩机_富士豪活塞压缩机_富士豪螺杆压缩机 | LZ-373测厚仪-华瑞VOC气体检测仪-个人有毒气体检测仪-厂家-深圳市深博瑞仪器仪表有限公司 | 大型低温冷却液循环泵-低温水槽冷阱「厂家品牌」京华仪器_京华仪器 | 天然气分析仪-液化气二甲醚分析仪|传昊仪器| 清水-铝合金-建筑模板厂家-木模板价格-铝模板生产「五棵松」品牌 | 西安展台设计搭建_西安活动策划公司_西安会议会场布置_西安展厅设计西安旭阳展览展示 | 振动时效_振动时效仪_超声波冲击设备-济南驰奥机电设备有限公司 北京宣传片拍摄_产品宣传片拍摄_宣传片制作公司-现像传媒 | ETFE膜结构_PTFE膜结构_空间钢结构_膜结构_张拉膜_浙江萬豪空间结构集团有限公司 | 不锈钢法兰-碳钢法兰-法兰盘生产加工厂家-[鼎捷峰]-不锈钢法兰-碳钢法兰-法兰盘生产加工厂家-[鼎捷峰] | 有机肥设备生产制造厂家,BB掺混肥搅拌机、复合肥设备生产线,有机肥料全部加工设备多少钱,对辊挤压造粒机,有机肥造粒设备 -- 郑州程翔重工机械有限公司 | 胀套-锁紧盘-风电锁紧盘-蛇形联轴器「厂家」-瑞安市宝德隆机械配件有限公司 | 创富网-B2B网站|供求信息网|b2b平台|专业电子商务网站 | 广东成考网-广东成人高考网| 菲希尔X射线测厚仪-菲希尔库伦法测厚仪-无锡骏展仪器有限责任公司 | 河南档案架,档案密集架,手动密集架,河南密集架批发/报价 | 苏州伊诺尔拆除公司_专业酒店厂房拆除_商场学校拆除_办公楼房屋拆除_家工装拆除拆旧 | 板式换网器_柱式换网器_自动换网器-郑州海科熔体泵有限公司 | 换链神器官网-友情链接交换、购买交易于一体的站长平台 | 上海道勤塑化有限公司 | 东莞市海宝机械有限公司-不锈钢分选机-硅胶橡胶-生活垃圾-涡电流-静电-金属-矿石分选机 | 成都LED显示屏丨室内户外全彩led屏厂家方案报价_四川诺显科技 | 事迹材料_个人事迹名人励志故事| 南京展台搭建-南京展会设计-南京展览设计公司-南京展厅展示设计-南京汇雅展览工程有限公司 | 臭氧灭菌箱-油桶加热箱-原料桶加热融化烘箱-南京腾阳干燥设备厂 臭氧发生器_臭氧消毒机 - 【同林品牌 实力厂家】 | 深圳市宏康仪器科技有限公司-模拟高空低压试验箱-高温防爆试验箱-温控短路试验箱【官网】 | 焊接减速机箱体,减速机箱体加工-淄博博山泽坤机械厂 | 杜甫仪器官网|实验室平行反应器|升降水浴锅|台式低温循环泵 | 壹作文_中小学生优秀满分作文大全 | 电主轴-高速精密电主轴-高速电机厂家-瑞德沃斯品牌有限公司 | 深圳网站建设-高端企业网站开发-定制网页设计制作公司 | 国产液相色谱仪-超高效液相色谱仪厂家-上海伍丰科学仪器有限公司 | 清洁设备_洗地机/扫地机厂家_全自动洗地机_橙犀清洁设备官网 | 仓储笼_仓储货架_南京货架_仓储货架厂家_南京货架价格低-南京一品仓储设备制造公司 | 杭州货架订做_组合货架公司_货位式货架_贯通式_重型仓储_工厂货架_货架销售厂家_杭州永诚货架有限公司 | 干培两用箱-细菌恒温培养箱-菲斯福仪器 | 本安接线盒-本安电路用接线盒-本安分线盒-矿用电话接线盒-JHH生产厂家-宁波龙亿电子科技有限公司 |