python 正則表達式貪婪模式與非貪婪模式原理、用法實例分析

發布時間：2020-08-31 04:42:03 來源：腳本之家閱讀：216 作者：兩步一腳印欄目：開發技術

本文實例講述了python 正則表達式貪婪模式與非貪婪模式原理、用法。分享給大家供大家參考，具體如下：

之前未接觸過正則表達式，今日看python網絡爬蟲的源碼，里面一行正則表達式匹配的代碼初看之下，不是很理解，代碼如下：

myItems = re.findall('<div.*?class="content".*?title="(.*?)">(.*?)</div>',unicodePage,re.S)

“.*?”這種匹配方式，按理解應該是匹配任意字符0個或多個（re.S模式，“.”可以匹配“\n”），但是這個“？”總覺的在這兒是多余的，既然不理解，就敲代碼試試：

import re
patern = re.compile('www\..*')
match2 = patern.match("www.baidu.com")
if match2:
  print(match2.group())
else:
  print("match2 don't match")
#output
>>> ==================RESTART =============================
>>> 
www.baidu.com

這個結果，應該說是意料之中，加個“？”呢？

import re
patern = re.compile('www\..*?')
match2 = patern.match("www.baidu.com")
if match2:
  print(match2.group())
else:
  print("match2 don't match")
#output
>>> ==================RESTART =============================
>>> 
www.

竟然是這個結果。。。“.?”一個字符都沒匹配，按“.”、“”、“?”的匹配理解，也就是“*”“？”均匹配前面字符0次，才會是這個結果，可是為啥就是0次了？

這就是正則表達式貪婪模式和非貪婪模式：

貪婪模式，總是嘗試匹配盡可能多的字符；
非貪婪模式則相反，總是嘗試匹配盡可能少的字符。

Python里數量詞默認是貪婪的，這就解釋了第一個匹配實驗，輸出結果為”www.baidu.com”（貪婪模式），也就是說第二個匹配實驗是非貪婪模式，僅僅因為加了“？”，繼續實驗

import re
patern = re.compile('www\..?')
match2 = patern.match("www.baidu.com")
if match2:
  print(match2.group())
else:
  print("match2 don't match")
#output
>>> ==================RESTART =============================
>>> 
www.b

此次匹配結果，顯然是貪婪模式。奇怪了，也就是“？”的特殊組合才是非貪婪模式。

網上搜索得如下說明：

標準量詞修飾的子表達式，在可匹配可不匹配的情況下，總會先嘗試進行匹配，稱這種方式為匹配優先，或者貪婪模式。此前介紹的一些量詞，“{m}”、“{m,n}”、“{m,}”、“?”、“*”和“+”都是匹配優先的。
一些NFA正則引擎支持忽略優先量詞，也就是在標準量詞后加一個“?”，此時，在可匹配可不匹配的情況下，總會先忽略匹配，只有在由忽略優先量詞修飾的子表達式，必須進行匹配才能使整個表達式匹配成功時，才會進行匹配，稱這種方式為忽略優先，或者非貪婪模式。忽略優先量詞包括“{m}?”、“{m,n}?”、“{m,}?”、“??”、“*?”和“+?”。

顯然“*？”的組合是非貪婪模式，猜想正確，原來如此啊。

PS：這里再為大家提供2款非常方便的正則表達式工具供大家參考使用：

JavaScript正則表達式在線測試工具：
http://tools.jb51.net/regex/javascript

正則表達式在線生成工具：
http://tools.jb51.net/regex/create_reg

更多關于Python相關內容可查看本站專題：《Python正則表達式用法總結》、《Python數據結構與算法教程》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經典教程》及《Python文件與目錄操作技巧匯總》

希望本文所述對大家Python程序設計有所幫助。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

python 正則表達式貪婪模式與非貪婪模式原理、用法實例分析

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

python 正則表達式貪婪模式與非貪婪模式原理、用法實例分析

猜你喜歡

最新資訊

相關推薦

相關標簽