电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Python word文本自動化操作實現方法解析

瀏覽:71日期:2022-07-06 13:30:42

之前介紹了一個Python包 openpyxl ,用于處理 Excel ;而對于 Word 文本時同樣也有對應的 Python庫 Python-docx,在日常辦公中,如果需要處理多個 word 文本,且操作步驟都是重復單調的,我想這個庫就可以幫到你

在了解 Python-docx 常用函數之前,需要知道 在 Python-docx 各命令所對應 word 各部件,下圖所示,

Document 指的是 word 文檔; paragraph 對應段落; run 對應 一句話中的各個字段,樣式調整時,一般面向的操作對象都是逐字段進行;

Python word文本自動化操作實現方法解析

1,安裝 Python-docx

通過 pip 工具即可進行安裝,在命令行中輸入 pip install Python-docx 即可

Python word文本自動化操作實現方法解析

2,創建或打開 Document

Python-docx 導入包時是以 docx 命令存在的,與 Opencv 的 Python 版本導入方法相似;創建文件、打開文件以 Document() 命令操作,這里操作時需要注意幾個點:

1,Document() 命令是基于默認”模板“創建一個空白文檔,隨后可對文檔進行編輯操作,最后沒有用 save() 函數存儲的話,文檔將伴隨程序結束同內存一起

2,Document(path) 命令表示打開一個本地已經存在的 docx 文件,path 表示存放目錄若不存在則程序報錯;下面代碼中,創建了一個空白 docx,賦值給 document

from docx import Document

document = Document()

3,加入一段落

段落作為 docx 文檔正文的主要成分,那怎樣在創建好的 Document 中加入一段話呢?官方給出了兩種方式

1,在文檔后面插入

這種方法是比較常見且簡單的,命令如下

paragraph = document.add_paragraph(’Lorem ipsum dolor sit amet.’)

方法中將創建好的段落引用指向 paragraph ,表明了光標的位置,后面的一些操作可以借助 paragraph 引用變量來作為定位操作

2,在指定地方的前面插入

文檔編輯正常順序是在末尾進行編輯,但有時在編輯時可能失誤少輸入一段話或文字,這時就用到 在指定位置前面 進行插入操作

prior_paragraph = paragraph.insert_paragraph_before(’Lorem ipsum’)

此命令常用于 修正文檔 ,當需要在一段話前面添加一些別的文字時。

4,標題

docx 中 會用一、二、三級標題將正文分為幾部分,讓文本主次感更強;Python-docx 有對應的內置函數供我們使用,內置函數中標題分為主標題和子標題

創建標題的函數方法中,有一個參數 level 可進行修改,若不設定時默認為 主標題(leve = 0);

document.add_heading(’The REAL meaning of the universe’)

子標題分為 1-9 九個等級,修改參數 level 即可

document.add_heading(’The role of dolphins’, level=2)

5,分頁符

在 Word 中進行文本編輯,想在單獨的一個新頁面編寫文本時,就需要加入一個 強制分頁符,命令如下

document.add_page_break()

這里需要注意下,加入分頁符之后,新頁面上編輯的段落樣式屬性與之前頁面段落屬性是分隔開的

6,表格

在文檔中創建一個 2*2 的 表格

table = document.add_table(rows=2, cols=2)

表格中每個單元格可進行文本編輯,顏色填充;對于特定表格而言可通過 row、column 索引來進行定位,這里借助了操作 Excel 表格的思想

cell = table.cell(0, 1)

賦值其文本內容

cell.text = ’parrot, possibly dead’

對一個一個單元格修改操作太麻煩了,可以一次選中指定列,對其單元格數據進行逐個修改

row = table.rows[1]row.cells[0].text = ’Foo bar to you.’row.cells[1].text = ’And a hearty foo bar to you too sir!’

table.rows[index] 返回索引為 index 的指定行,根據 .rows和.cols 表示 表格的全部行或列是可迭代的,因此可通過 for 循環來訪問每一個單元格

for row in table.rows:for cell in row.cells:print(cell.text)

因為 .rows 和 .cols 是可迭代的,通過 len() 命令來獲取行、列數

row_count = len(table.rows)col_count = len(table.columns)

除了以上操作之外,還可以向 table 中逐漸添加行、列命令

row = table.add_row()col = table.add_col()

上面提到了 創建表格,單元格修改,創建新行/列,逐行/列迭代,下面用個實例做個簡單總結,代碼中完成功能如下:

1,item 創建一個 3*3 的元組數據; 2,在 word 中新建一個 table,一行三列; 3,創建好的 table 的表頭依次設置為 Qty,SKU,Description; 4,將 item 中的元素,以 table 逐行 3 個的方式創建;

# get table data -------------items = ( (7, ’1024’, ’Plush kittens’), (3, ’2042’, ’Furbees’), (1, ’1288’, ’French Poodle Collars, Deluxe’),)# add table ------------------table = document.add_table(1, 3)# populate header row --------heading_cells = table.rows[0].cellsheading_cells[0].text = ’Qty’heading_cells[1].text = ’SKU’heading_cells[2].text = ’Description’# add a data row for each itemfor item in items: cells = table.add_row().cells cells[0].text = str(item.qty) cells[1].text = item.sku cells[2].text = item.desc

此外,還可修改 表格的樣式,word 文檔中的表格樣式這里都可以設定(樣式名稱可以通過word 文檔自有的樣式,將鼠標放到樣式的縮略圖上即可查看),但需要注意的是,使用樣式時需要去掉word軟件中樣式名字中的空格,例如下面 Office 原樣式名字為 Light Shading-Accent1,這里直接把中間空格去掉

table.style = ’LightShading-Accent1’

7,圖片

在 python-docx 中添加圖片用下面命令即可完成

document.add_picture(’image-filename.png’)

上面加入的是本地文件 path ,除此之外還可以使用 file-like object,這種格式對于數據庫或者網絡上的圖片讀取時時非常方便的

修改圖片大小

python-docx 加入圖像默認表示的是 native size,正常圖片加入時會出現相同圖片的一側出現 4.167 inches 的空白處,大概占比紙張寬度的一半;在獲取想要圖像大小時,可以指定寬度或高度設為較為方便的單位

from docx.shared import Inches

document.add_picture(’image-filename.png’, width=Inches(1.0))

8, 應用段落樣式

設定段落樣式方法有兩種,一種創建時就可以設置

document.add_paragraph(’Lorem ipsum dolor sit amet.’, style=’ListBullet’)

另一種是創建完之后再再進行設置(這時不需要去掉樣式名稱中的空格)

paragraph = document.add_paragraph(’Lorem ipsum dolor sit amet.’)paragraph.style = ’List Bullet’

9,字體加黑并斜體化

對字體做斜體和加黑操作之前, 需要理解在一個段落中都做了什么事情,簡單來說兩部分:

1,一個段落具有全部 block-level formatting ,比如制表符、行高、tabs 等;

2,Character-level formatting ,例如粗體、斜體,應用的是 run對象,在段落中的所有內容必須是一個 run ,且不僅包含一個,Run 對象同時包含一個 .bold 和.italic 屬性,可讓你來對其值進行設置

paragraph = document.add_paragraph(’Lorem ipsum ’)run = paragraph.add_run(’dolor’)run.bold = Trueparagraph.add_run(’ sit amet.’)

上面代碼中最后創建的文本格式形如:Lorem ipsum dolor sit amet.

需要注意的是設置 bold 或 italic 時,可以把 .add_run() 命令直接放在右邊

paragraph.add_run(’dolor’).bold = True

# is equivalent to:

run = paragraph.add_run(’dolor’)run.bold = True

# except you don’t have a reference to `run` afterward

10,字符樣式

除了上面加黑、斜體之外、還可定義字符樣式( character styles ), 定義時加入一行新的 run 對象;例如

paragraph = document.add_paragraph(’Normal text, ’)paragraph.add_run(’text with emphasis.’, ’Emphasis’)

上面創建一個文本 ,結果如下

Normal text,text with emphasis. ;text with emphasis. 部分應用 Emphasis(強調) 的字符格式

上面代碼也可改為;

paragraph = document.add_paragraph(’Normal text, ’)run = paragraph.add_run(’text with emphasis.’)run.style = ’Emphasis’

與段落樣式一樣,樣式名字與 Word UI 里的一樣,在 Word 樣式管理器中都能找得到!

Python word文本自動化操作實現方法解析

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: python
相關文章:
主站蜘蛛池模板: 纸张环压仪-纸张平滑度仪-杭州纸邦自动化技术有限公司 | 锂电混合机-新能源混合机-正极材料混料机-高镍,三元材料混料机-负极,包覆混合机-贝尔专业混合混料搅拌机械系统设备厂家 | 垃圾压缩设备_垃圾处理设备_智能移动式垃圾压缩设备--山东明莱环保设备有限公司 | 仓储笼_金属箱租赁_循环包装_铁网箱_蝴蝶笼租赁_酷龙仓储笼租赁 测试治具|过炉治具|过锡炉治具|工装夹具|测试夹具|允睿自动化设备 | 翰香原枣子坊加盟费多少钱-正宗枣核糕配方培训利润高飘香 | 大型果蔬切片机-水果冬瓜削皮机-洗菜机切菜机-肇庆市凤翔餐饮设备有限公司 | 合肥仿石砖_合肥pc砖厂家_合肥PC仿石砖_安徽旭坤建材有限公司 | 大倾角皮带机-皮带输送机-螺旋输送机-矿用皮带输送机价格厂家-河南坤威机械 | 皮带式输送机械|链板式输送机|不锈钢输送机|网带输送机械设备——青岛鸿儒机械有限公司 | 医院专用门厂家报价-医用病房门尺寸大全-抗菌木门品牌推荐 | 阿里巴巴诚信通温州、台州、宁波、嘉兴授权渠道商-浙江联欣科技提供阿里会员办理 | 宜兴紫砂壶知识分享 - 宜兴壶人 医用空气消毒机-医用管路消毒机-工作服消毒柜-成都三康王 | 干粉砂浆设备-干粉砂浆生产线-干混-石膏-保温砂浆设备生产线-腻子粉设备厂家-国恒机械 | [品牌官网]贵州遵义双宁口腔连锁_贵州遵义牙科医院哪家好_种植牙_牙齿矫正_原华美口腔 | 商秀—企业短视频代运营_抖音企业号托管 | 上海办公室装修,办公楼装修设计,办公空间设计,企业展厅设计_写艺装饰公司 | 盘式曝气器-微孔曝气器-管式曝气器-曝气盘-斜管填料 | 郑州市前程水处理有限公司 | 健康管理师报名入口,2025年健康管理师考试时间信息网-网站首页 塑料造粒机「厂家直销」-莱州鑫瑞迪机械有限公司 | 上海乾拓贸易有限公司-日本SMC电磁阀_德国FESTO电磁阀_德国FESTO气缸 | 安平县鑫川金属丝网制品有限公司,防风抑尘网,单峰防风抑尘,不锈钢防风抑尘网,铝板防风抑尘网,镀铝锌防风抑尘网 | 氧化铝球_高铝球_氧化铝研磨球-淄博誉洁陶瓷新材料有限公司 | 电动葫芦|环链电动葫芦-北京凌鹰名优起重葫芦 | BOE画框屏-触摸一体机-触控查询一体机-触摸屏一体机价格-厂家直销-触发电子 | 橡胶弹簧|复合弹簧|橡胶球|振动筛配件-新乡市永鑫橡胶厂 | 钢化玻璃膜|手机钢化膜|钢化膜厂家|手机保护膜-【东莞市大象电子科技有限公司】 | _网名词典_网名大全_qq网名_情侣网名_个性网名| 德州网站开发定制-小程序开发制作-APP软件开发-「两山开发」 | 自清洗过滤器-全自动自清洗过反冲洗过滤器 - 中乂(北京)科技有限公司 | 南京泽朗生物科技有限公司 | 南京PVC快速门厂家南京快速卷帘门_南京pvc快速门_世界500强企业国内供应商_南京美高门业 | 中视电广_短视频拍摄_短视频推广_短视频代运营_宣传片拍摄_影视广告制作_中视电广 | 武汉高低温试验箱_恒温恒湿试验箱厂家-武汉蓝锐环境科技有限公司 | 不锈钢轴流风机,不锈钢电机-许昌光维防爆电机有限公司(原许昌光维特种电机技术有限公司) | 医学模型生产厂家-显微手术模拟训练器-仿真手术模拟训练系统-北京医教科技 | 板式换热器_板式换热器价格_管式换热器厂家-青岛康景辉 | 二维运动混料机,加热型混料机,干粉混料机-南京腾阳干燥设备厂 | 数年网路-免费在线工具您的在线工具箱-shuyear.com | 酸度计_PH计_特斯拉计-西安云仪| 聚合甘油__盐城市飞龙油脂有限公司 | 制氮设备-变压吸附制氮设备-制氧设备-杭州聚贤气体设备制造有限公司 | 亮化工程,亮化设计,城市亮化工程,亮化资质合作,长沙亮化照明,杰奥思【官网】 |