怎么在python3中使用正則re模塊

發布時間：2021-03-18 16:35:03 來源：億速云閱讀：295 作者：Leah 欄目：開發技術

本篇文章給大家分享的是有關怎么在python3中使用正則re模塊，小編覺得挺實用的，因此分享給大家學習，希望大家閱讀完這篇文章后可以有所收獲，話不多說，跟著小編一起來看看吧。

一、正則

1.正則表達式定義

正則就是用一些具有特殊含義的符號組合到一起（稱為正則表達式）來描述字符或者字符串的方法。或者說：正則就是用來描述一類事物的規則。（在Python中）它內嵌在Python中，并通過 re 模塊實現。正則表達式模式被編譯成一系列的字節碼，然后由用 C 編寫的匹配引擎執行。

2.目的和特點

給定一個正則表達式和另一個字符串，我們可以達到如下的目的：

給定的字符串是否符合正則表達式的過濾邏輯（稱作“匹配”）：

可以通過正則表達式，從字符串中獲取我們想要的特定部分。

正則表達式的特點是：

靈活性、邏輯性和功能性非常強；

可以迅速地用極簡單的方式達到字符串的復雜控制。

由于正則表達式主要應用對象是文本，因此它在各種文本編輯器場合都有應用，小到著名編輯器EditPlus，大到Microsoft Word、Visual Studio等大型編輯器，都可以使用正則表達式來處理文本內容。

3.常用的正則表達式

怎么在python3中使用正則re模塊

4.貪婪模式與非貪婪模式

正則表達式通常用于在文本中查找匹配的字符串。Python里數量詞默認是貪婪的（在少數語言里也可能是默認非貪婪），總是嘗試匹配盡可能多的字符；非貪婪的則相反，總是嘗試匹配盡可能少的字符。例如：正則表達式"ab*“如果用于查找"abbbc”，將找到"abbb"。而如果使用非貪婪的數量詞"ab*?"，將找到"a"。

5.反斜杠

與大多數編程語言相同，正則表達式里使用"“作為轉義字符，這就可能造成反斜杠困擾。假如你需要匹配文本中的字符”"，那么使用編程語言表示的正則表達式里將需要4個反斜杠"\\"：前兩個和后兩個分別用于在編程語言里轉義成反斜杠，轉換成兩個反斜杠后再在正則表達式里轉義成一個反斜杠。Python里的原生字符串很好地解決了這個問題，這個例子中的正則表達式可以使用r"\“表示。同樣，匹配一個數字的”\d"可以寫成r"\d"。有了原生字符串，你再也不用擔心是不是漏寫了反斜杠，寫出來的表達式也更直觀。

二、python3正則模塊re

1.match

match(string[, pos[, endpos]]) | re.match(pattern, string[, flags]):

Match對象是一次匹配的結果，包含了很多關于此次匹配的信息，可以使用Match提供的可讀屬性或方法來獲取這些信息。

屬性：

string: 匹配時使用的文本。
re: 匹配時使用的Pattern對象。
pos: 文本中正則表達式開始搜索的索引。值與Pattern.match()和Pattern.seach()方法的同名參數相同。
endpos: 文本中正則表達式結束搜索的索引。值與Pattern.match()和Pattern.seach()方法的同名參數相同。
lastindex: 最后一個被捕獲的分組在文本中的索引。如果沒有被捕獲的分組，將為None。
lastgroup: 最后一個被捕獲的分組的別名。如果這個分組沒有別名或者沒有被捕獲的分組，將為None。

方法：

group([group1, …])

獲得一個或多個分組截獲的字符串；指定多個參數時將以元組形式返回。group1可以使用編號也可以使用別名；編號0代表整個匹配的子串；不填寫參數時，返回group(0)；沒有截獲字符串的組返回None；截獲了多次的組返回最后一次截獲的子串。

groups([default])

以元組形式返回全部分組截獲的字符串。相當于調用group(1,2,…last)。default表示沒有截獲字符串的組以這個值替代，默認為None。

groupdict([default])

返回以有別名的組的別名為鍵、以該組截獲的子串為值的字典，沒有別名的組不包含在內。default含義同上。

start([group])

返回指定的組截獲的子串在string中的起始索引（子串第一個字符的索引）。group默認值為0。

end([group])

返回指定的組截獲的子串在string中的結束索引（子串最后一個字符的索引+1）。group默認值為0。

span([group])

返回(start(group), end(group))。

expand(template)

將匹配到的分組代入template中然后返回。template中可以使用\id或\g、\g引用分組，但不能使用編號0。\id與\g是等價的；但\10將被認為是第10個分組，如果你想表達\1之后是字符'0'，只能使用\g<1>0。

import re
ret1 = re.match('t.{6}w', 'taaa333w123')
try:
  print('匹配到的數據是：', ret1.group()) # 匹配的是一個group
except:
  print('沒有匹配到數據')

2.search

search(string[, pos[, endpos]]) | re.search(pattern, string[,flags])

這個方法用于查找字符串中可以匹配成功的子串。從string的pos下標處起嘗試匹配pattern，如果pattern結束時仍可匹配，則返回一個Match對象；若無法匹配，則將pos加1后重新嘗試匹配；直到pos=endpos時仍無法匹配則返回None。

pos和endpos的默認值分別為0和len(string))；re.search()無法指定這兩個參數，參數flags用于編譯pattern時指定匹配模式。

ret5 = re.search('^[0-9].*', '1hello python') # ^代表以什么開頭
print(ret5.group())

3.split,findall,finditer三個方法

split(string[, maxsplit]) | re.split(pattern, string[, maxsplit])
findall(string[, pos[, endpos]]) | re.findall(pattern, string[, flags])
finditer(string[, pos[, endpos]]) | re.finditer(pattern, string[, flags])

split類似string中的split方法，不多解釋

findall()方法搜索string，以列表形式返回全部能匹配的子串。實例：

import re
p = re.compile(r'\d+')
print(p.findall('one1two2three3four4'))

輸出

['1', '2', '3', '4']

finditer()方法搜索string，返回一個順序訪問每一個匹配結果（Match對象）的迭代器。實例：

import re
p = re.compile(r'\d+')
for m in p.finditer('one1two2three3four4'):
  print(m.group(),)

輸出

4.sub

sub(repl, string[, count]) | re.sub(pattern, repl, string[, count])

使用repl替換string中每一個匹配的子串后返回替換后的字符串。

當repl是一個字符串時，可以使用\id或\g、\g引用分組，但不能使用編號0。

當repl是一個方法時，這個方法應當只接受一個參數（Match對象），并返回一個字符串用于替換（返回的字符串中不能再引用分組）。

count用于指定最多替換次數，不指定時全部替換。

import re
p = re.compile(r'(\w+) (\w+)')
s = 'i say, hello world!'
print(p.sub(r'\2 \1', s))
def func(m):
  return m.group(1).title() + ' ' + m.group(2).title()
print(p.sub(func, s))

輸出

say i, world hello!

以上就是怎么在python3中使用正則re模塊，小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

怎么在python3中使用正則re模塊

一、正則

1.正則表達式定義

2.目的和特點

正則表達式的特點是：

3.常用的正則表達式

4.貪婪模式與非貪婪模式

5.反斜杠

二、python3正則模塊re

1.match

2.search

3.split,findall,finditer三個方法

4.sub

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

怎么在python3中使用正則re模塊

一、正則

1.正則表達式定義

2.目的和特點

正則表達式的特點是：

3.常用的正則表達式

4.貪婪模式與非貪婪模式

5.反斜杠

二、python3正則模塊re

1.match

2.search

3.split,findall,finditer三個方法

4.sub

猜你喜歡

最新資訊

相關推薦

相關標簽