文章詳情頁(yè)

淺析Python 多行匹配模式

瀏覽：3日期：2022-07-16 13:14:06

問題

你正在試著使用正則表達(dá)式去匹配一大塊的文本，而你需要跨越多行去匹配。

解決方案

這個(gè)問題很典型的出現(xiàn)在當(dāng)你用點(diǎn)(.)去匹配任意字符的時(shí)候，忘記了點(diǎn)(.)不能匹配換行符的事實(shí)。比如，假設(shè)你想試著去匹配C語(yǔ)言分割的注釋：

>>> comment = re.compile(r’/*(.*?)*/’)>>> text1 = ’/* this is a comment */’>>> text2 = ’’’/* this is a... multiline comment */... ’’’>>>>>> comment.findall(text1)[’ this is a comment ’]>>> comment.findall(text2)[]>>>

為了修正這個(gè)問題，你可以修改模式字符串，增加對(duì)換行的支持。比如：

>>> comment = re.compile(r’/*((?:.|n)*?)*/’)>>> comment.findall(text2)[’ this is an multiline comment ’]>>>

在這個(gè)模式中，(?:.|n) 指定了一個(gè)非捕獲組(也就是它定義了一個(gè)僅僅用來做匹配，而不能通過單獨(dú)捕獲或者編號(hào)的組)。

討論

re.compile() 函數(shù)接受一個(gè)標(biāo)志參數(shù)叫 re.DOTALL ，在這里非常有用。它可以讓正則表達(dá)式中的.匹配包括換行符在內(nèi)的任意字符。比如：

>>> comment = re.compile(r’/*(.*?)*/’, re.DOTALL)>>> comment.findall(text2)[’ this is an multiline comment ’]

對(duì)于簡(jiǎn)單的情況使用 re.DOTALL 標(biāo)記參數(shù)工作的很好，但是如果模式非常復(fù)雜或者是為了構(gòu)造字符串令牌而將多個(gè)模式合并起來(2.18節(jié)有詳細(xì)描述)，這時(shí)候使用這個(gè)標(biāo)記參數(shù)就可能出現(xiàn)一些問題。如果讓你選擇的話，最好還是定義自己的正則表達(dá)式模式，這樣它可以在不需要額外的標(biāo)記參數(shù)下也能工作的很好。

以上就是淺析Python 多行匹配模式的詳細(xì)內(nèi)容，更多關(guān)于Python 多行匹配模式的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

Python 編程

上一條：Python 解析簡(jiǎn)單的XML數(shù)據(jù)下一條：Python圖像處理二值化方法實(shí)例匯總

相關(guān)文章：

1. 詳解php如何合并身份證正反面圖片為一張圖片2. 得到XML文檔大小的方法3. ASP錯(cuò)誤捕獲的幾種常規(guī)處理方式4. asp.net core項(xiàng)目授權(quán)流程詳解5. 詳解JS前端使用迭代器和生成器原理及示例6. ASP編碼必備的8條原則7. Python 如何將字符串每?jī)蓚€(gè)用空格隔開8. .NET 中配置從xml轉(zhuǎn)向json方法示例詳解9. 解決python 輸出到csv 出現(xiàn)多空行的情況10. asp錯(cuò)誤 '80040e21' 多步 OLE DB 操作產(chǎn)生錯(cuò)誤

排行榜

					
					PHP 編碼規(guī)范及建議
改進(jìn)JAVA字符串分解的方法
python實(shí)現(xiàn)猜數(shù)游戲(保存游戲記錄）
Python切割圖片成九宮格的示例代碼
Python使用shutil模塊實(shí)現(xiàn)文件拷貝
python實(shí)現(xiàn)梯度下降算法的實(shí)例詳解
python 實(shí)現(xiàn)aes256加密
使用python庫(kù)xlsxwriter庫(kù)來輸出各種xlsx文件的示例
Python 如何將字符串每?jī)蓚€(gè)用空格隔開
如何用python開發(fā)Zeroc Ice應(yīng)用
利用python+request通過接口實(shí)現(xiàn)人員通行記錄上傳功能