电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術(shù)文章
文章詳情頁

Python利用PyPDF2庫獲取PDF文件總頁碼實(shí)例

瀏覽:21日期:2022-07-31 09:13:02

Python中可以利用PyPDF2庫來獲取該pdf文件的總頁碼,可以根據(jù)下面的方法一步步進(jìn)行下去:

1、首先,要安裝PyPDF2庫,利用以下命令即可:

pip install PyPDF2

2、接著,就是直接編寫代碼了,其中我新建了一個(gè)py文件,名為file_utils.py,代碼如下:

from PyPDF2 import PdfFileReader def get_num_pages(file_path): ''' 獲取文件總頁碼 :param file_path: 文件路徑 :return: ''' reader = PdfFileReader(file_path) # 不解密可能會(huì)報(bào)錯(cuò):PyPDF2.utils.PdfReadError: File has not been decrypted if reader.isEncrypted: reader.decrypt(’’) page_num = reader.getNumPages() return page_num

3、這樣就可以獲得該pdf文件的總頁數(shù)了,但是需要傳遞文件路徑進(jìn)去,因?yàn)樾枰x取這個(gè)文件。

4、以上內(nèi)容僅供學(xué)習(xí)參考,謝謝!

補(bǔ)充知識(shí):使用python合并pdf文件帶書簽

1、需求:

將幾本紙質(zhì)書進(jìn)行了掃描,可是掃描的每頁生成一個(gè)pdf文件。需要怎么才能把這些pdf文件合成一個(gè)呢?adoba acrobat工具支持,可是收費(fèi)。我們平時(shí)用的都是adoba reader,只有讀pdf的功能沒有合并等高級(jí)功能。網(wǎng)上的一些免費(fèi)工具又擔(dān)心有病毒或綁定程序。

所以考慮看看pyton實(shí)現(xiàn)。網(wǎng)上找了下python合并pdf的腳本,發(fā)現(xiàn)也沒有添加書簽的功能的,有添加書簽的也不是很靈活。

所有對(duì)網(wǎng)上找的一個(gè)python程序進(jìn)行了升級(jí),可以實(shí)現(xiàn)合并pdf并每個(gè)章節(jié)加入書簽。

文件準(zhǔn)備:

先將掃描的pdf文件,每一章放到一個(gè)文件夾中,文件夾名字用章節(jié)名命名。這樣最終程序就能將章節(jié)名作為書簽了,而不是默認(rèn)將每頁都生成書簽。

Python利用PyPDF2庫獲取PDF文件總頁碼實(shí)例

2、程序代碼

代碼運(yùn)行環(huán)境:python3

需要安裝PyPDF2包:pip install PyPDF2

#!/usr/bin/env python3# -*- coding: utf-8 -*-’’’ 本腳本用來合并pdf文件,支持帶一級(jí)子目錄的 每章內(nèi)容分別放在不同的目錄下,目錄名為章節(jié)名 最終生成的pdf,按章節(jié)名生成書簽’’’import os, sys, codecsfrom PyPDF2 import PdfFileReader, PdfFileWriter, PdfFileMergerimport globdef getFileName(filepath): ’’’ 獲取當(dāng)前目錄下的所有pdf文件 ’’’ file_list = glob.glob(filepath+'/*.pdf') # 默認(rèn)安裝字典序排序,也可以安裝自定義的方式排序 # file_list.sort() return file_listdef get_dirs(filepath=’’, dirlist_out=[], dirpathlist_out=[]): # 遍歷filepath下的所有目錄 for dir in os.listdir(filepath): dirpathlist_out.append(filepath + ’’ + dir) return dirpathlist_outdef merge_childdir_files(path): ’’’ 每個(gè)子目錄下合并生成一個(gè)pdf ’’’ dirpathlist = get_dirs(path) if len(dirpathlist) == 0: print('當(dāng)前目錄不存在子目錄') sys.exit() for dir in dirpathlist: mergefiles(dir, dir)def mergefiles(path, output_filename, import_bookmarks=False): # 遍歷目錄下的所有pdf將其合并輸出到一個(gè)pdf文件中,輸出的pdf文件默認(rèn)帶書簽,書簽名為之前的文件名 # 默認(rèn)情況下原始文件的書簽不會(huì)導(dǎo)入,使用import_bookmarks=True可以將原文件所帶的書簽也導(dǎo)入到輸出的pdf文件中 merger = PdfFileMerger() filelist = getFileName(path) if len(filelist) == 0: print('當(dāng)前目錄及子目錄下不存在pdf文件') sys.exit() for filename in filelist: f = codecs.open(filename, ’rb’) file_rd = PdfFileReader(f) short_filename = os.path.basename(os.path.splitext(filename)[0]) if file_rd.isEncrypted == True: print(’不支持的加密文件:%s’%(filename)) continue merger.append(file_rd, bookmark=short_filename, import_bookmarks=import_bookmarks) print(’合并文件:%s’%(filename)) f.close() # out_filename = os.path.join(os.path.abspath(path), output_filename) merger.write(output_filename + '.pdf') print(’合并后的輸出文件:%s’%(output_filename)) merger.close()if __name__ == '__main__': # 每個(gè)章節(jié)一個(gè)子目錄,先分別合并每個(gè)子目錄文件為一個(gè)pdf,然后再將這些pdf合并為一個(gè)大的pdf,這樣做目的是想生成每個(gè)章節(jié)的書簽 # 1.指定目錄 # 原始pdf所在目錄 path = 'D:spdf' # 輸出pdf路徑和文件名 output_filename = 'D:spdf戰(zhàn)略規(guī)劃 公司實(shí)現(xiàn)持續(xù)成功的方法、工具和實(shí)踐 羅熙昶 2018-09' # 2.生成子目錄的pdf # merge_childdir_files(path) # 3.子目錄pdf合并為總的pdf mergefiles(path, output_filename)

3、程序使用

將要生成的pdf文件目錄導(dǎo)入到程序指定目錄下,例如我程序中的path是“D:spdf”,然后指定最終輸出的文件路徑及文件名,我上面的output_filename是'D:spdf戰(zhàn)略規(guī)劃 公司實(shí)現(xiàn)持續(xù)成功的方法、工具和實(shí)踐 羅熙昶 2018-09'

數(shù)據(jù)結(jié)果如下:

Python利用PyPDF2庫獲取PDF文件總頁碼實(shí)例

以上這篇Python利用PyPDF2庫獲取PDF文件總頁碼實(shí)例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 金属回收_废铜废铁回收_边角料回收_废不锈钢回收_废旧电缆线回收-广东益夫金属回收公司 | 电加热导热油炉-空气加热器-导热油加热器-翅片电加热管-科安达机械 | 继电器模组-IO端子台-plc连接线-省配线模组厂家-世麦德 | 路面机械厂家| 网站建设,北京网站建设,北京网站建设公司,网站系统开发,北京网站制作公司,响应式网站,做网站公司,海淀做网站,朝阳做网站,昌平做网站,建站公司 | 蔬菜清洗机_环速洗菜机_异物去除清洗机_蔬菜清洗机_商用洗菜机 - 环速科技有限公司 | 模切之家-专注服务模切行业的B2B平台! | 中天寰创-内蒙古钢结构厂家|门式刚架|钢结构桁架|钢结构框架|包头钢结构煤棚 | 手机游戏_热门软件app下载_好玩的安卓游戏下载基地-吾爱下载站 | 蓄电池回收,ups电池后备电源回收,铅酸蓄电池回收,机房电源回收-广州益夫铅酸电池回收公司 | 合肥注册公司|合肥代办营业执照、2024注册公司流程 | 天津试验仪器-电液伺服万能材料试验机,恒温恒湿标准养护箱,水泥恒应力压力试验机-天津鑫高伟业科技有限公司 | 搬运设备、起重设备、吊装设备—『龙海起重成套设备』 | CXB船用变压器-JCZ系列制动器-HH101船用铜质开关-上海永上船舶电器厂 | SEO网站优化,关键词排名优化,苏州网站推广-江苏森歌网络 | 环氧乙烷灭菌器_压力蒸汽灭菌器_低温等离子过氧化氢灭菌器 _低温蒸汽甲醛灭菌器_清洗工作站_医用干燥柜_灭菌耗材-环氧乙烷灭菌器_脉动真空压力蒸汽灭菌器_低温等离子灭菌设备_河南省三强医疗器械有限责任公司 | 苏州教学设备-化工教学设备-环境工程教学模型|同科教仪 | 成都竞价托管_抖音代运营_网站建设_成都SEM外包-成都智网创联网络科技有限公司 | 锯边机,自动锯边机,双面涂胶机-建业顺达机械有限公司 | 全自动包衣机-无菌分装隔离器-浙江迦南科技股份有限公司 | 石膏基自流平砂浆厂家-高强石膏基保温隔声自流平-轻质抹灰石膏粉砂浆批发-永康市汇利建设有限公司 | 威客电竞(vk·game)·电子竞技赛事官网| 河南mpp电力管_mpp电力管生产厂家_mpp电力电缆保护管价格 - 河南晨翀实业 | 耐高温风管_耐高温软管_食品级软管_吸尘管_钢丝软管_卫生级软管_塑料波纹管-东莞市鑫翔宇软管有限公司 | 变色龙PPT-国内原创PPT模板交易平台 - PPT贰零 - 西安聚讯网络科技有限公司 | 胃口福饺子加盟官网_新鲜现包饺子云吞加盟 - 【胃口福唯一官网】 | 珠海白蚁防治_珠海灭鼠_珠海杀虫灭鼠_珠海灭蟑螂_珠海酒店消杀_珠海工厂杀虫灭鼠_立净虫控防治服务有限公司 | 北京网站建设-企业网站建设-建站公司-做网站-北京良言多米网络公司 | 山东PE给水管厂家,山东双壁波纹管,山东钢带增强波纹管,山东PE穿线管,山东PE农田灌溉管,山东MPP电力保护套管-山东德诺塑业有限公司 | 江苏皓越真空设备有限公司 | 全球化工设备网—化工设备,化工机械,制药设备,环保设备的专业网络市场。 | 水环真空泵厂家,2bv真空泵,2be真空泵-淄博真空设备厂 | 无线对讲-无线对讲系统解决方案-重庆畅博通信 | 钢格板|热镀锌钢格板|钢格栅板|钢格栅|格栅板-安平县昊泽丝网制品有限公司 | 深圳市东信高科自动化设备有限公司| 全国冰箱|空调|洗衣机|热水器|燃气灶维修服务平台-百修家电 | 基业箱_环网柜_配电柜厂家_开关柜厂家_开关断路器-东莞基业电气设备有限公司 | 超声波乳化机-超声波分散机|仪-超声波萃取仪-超声波均质机-精浩机械|首页 | 宿松新闻网 宿松网|宿松在线|宿松门户|安徽宿松(直管县)|宿松新闻综合网站|宿松官方新闻发布 | 水篦子|雨篦子|镀锌格栅雨水篦子|不锈钢排水篦子|地下车库水箅子—安平县云航丝网制品厂 | 烽火安全网_加密软件、神盾软件官网 |