您好,登錄后才能下訂單哦!
這篇文章主要講解了“python正則表達中的re庫常用方法有哪些”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“python正則表達中的re庫常用方法有哪些”吧!
元字符 :
預定義字符集:
我進行組合一些復雜的正則表達式的時候是為了快捷去晚上找一些現成的模式,然后再自己進行修改,變成符合自己需要的一些正則表達式。
import re # 正則表達式中的一些使用的符號 # 匹配出現符合條件的 0 次的或者是 多次 str1 = 'qwertyuio1ui3oo467j398k' # 關鍵詞: * 下面的句子就是進行匹配 零次 或者是 多次(多個字符) 符合是數字的意思 pattern = re.compile(r'\d*') res = re.findall(pattern, str1) print(res) """" 顯示的結果: ['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', ''] """ # 關鍵詞: + 匹配一次或者是多次的結果 pattern = re.compile(r'\d+') res = re.findall(pattern, str1) print(res) """ 顯示結果: ['1', '3', '467', '398'] """ # 關鍵詞: ? 匹配0次或者是1次的結果 pattern = re.compile(r'\d?') res = re.findall(pattern, str1) print(res) """ ['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '4', '6', '7', '', '3', '9', '8', '', ''] """ # {m}精確匹配m次 (比如寫進去的3,那么他就是匹配到是3個數字字符串的所有小字符串) pattern = re.compile(r'\d{3}') res = re.findall(pattern, str1) print(res) # 結果:['467', '398'] # {m, n} 最少匹配m次,最多匹配n次 # 記住在{}里面是不能隨便加上空格的? pattern = re.compile(r'\d{1,3}') res = re.findall(pattern, str1) print(res) # 結果:['1', '3', '467', '398']
match()函數只檢測 目標字符(串) 是不是在string的開始位置匹配,search()會掃描整個string查找匹配, match()只有在0位置匹配成功才會有返回,如果不是開始位置匹配成功,match()就會返回None
代碼解釋:
import re
m = re.match('lsp','hhttlsp')
if m is not None:
print(m.group())
else:
print('noneFine')
顯示結果:
noneFine
n = re.search('lsp','hhttlsp')
if n is not None:
print(n.group())
else:
print(noneFine')
顯示結果:
lsp
import re n = re.search('lsp','hhttlsp') if n: print(n.group()) else: print('noneFine') # 顯示結果: # lsp m = re.match('lsp','hhttlsp') if m: print(m.group()) else: print('noneFine') # 顯示結果: # noneFine
python的re庫有兩個函數/方法用于實現搜索和替換功能: sub()和subn().兩者幾乎一樣,都是將某字符串中所有匹配正則表達式的部分進行某種形式的替換.用來替換的部分通常是一個字符串,但它也可能是一個函數,該函數返回一個用來替換的字符串.subn()和 sub()一樣,但subn()還返回一個表示替換的總數,替換后的字符串和表示替換總數的數字一起作為一個擁有兩個元素的元組返回.
# 可以使用sub()方法來進行查詢和替換,sub方法的格式為: # sub(replacement, string[, count=0]) # replacement是被替換成的文本 # string是需要被替換的文本 # count是一個可選參數,指最大被替換的數量 # 下面進行將所有的數字給進行替換掉 pattern = re.compile(r'\d') res = re.sub(pattern, '替換掉的數字 ',str1) print(res) # 下文結果,為了方便大家看到換了多少個數字,我使用了換行將字符串給換行看出有幾次換了數字 """ qwertyuio替換掉的數字 ui替換掉的數字 oo替換掉的數字 替換掉的數字 替換掉的數字 j替換掉的數字 替換掉的數字 替換掉的數字 k """
# 加上顯示修改了多少次 res = re.subn(pattern, '替換掉的數字 ',str1) print(res) """ 結果: ('qwertyuio替換掉的數字 ui替換掉的數字 oo替換掉的數字 替換掉的數字 替換掉的數字 j替換掉的數字 替換掉的數字 替換掉的數字 k', 8) """
re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,則返回一個列表,否則返回原string列表;
第1個參數:正則表達式
第2個參數:要匹配查找的原始字符串;
第3個參數:可選參數,表示最大的拆分次數,默認為0,表示全部分割;
第4個參數:可選參數,標志位,用于控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等等;
特別注意: 此方法并不是完全匹配。它僅僅決定在字符串開始的位置是否匹配。所以當pattern結束時若還有剩余字符,仍然成功。若想進行完全匹配,可以在表達式末尾加上邊界匹配符'$'
str2 = '自然語言處理123機器學習456深度學習' pattern = re.compile(r'\d+') res = re.split(pattern, str2) print(res) # 結果: # ['自然語言處理', '機器學習', '深度學習']
Python的re模塊是第一個提出解決方案的模塊:命名捕獲組和命名后向引用。(?P <name> group)將組的匹配捕獲到后向引用“名稱”中。
str2 = '自然語言處理123機器學習456深度學習' pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)') m = re.search(pattern, str2) print(m.group('lsp')) # 結果為: # 機器學習
str2 = '自然語言處理123機器學習456深度學習' pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)') m = re.search(pattern, str2) print(m.group('dota')) # 結果為: # 123
進行號碼的篩選,小嘗試:
# 篩選號碼 str3 = 'number 132-3209-*******' pattern = re.compile(r'(\d\d\d-\d\d)') res = re.search(pattern, str3) print(res.group()) # 顯示結果: # 132-32
全部代碼:
# -*- coding:utf-8 -*- # @Author : DaFuChen # @File : demo1.py # @software: PyCharm import re # 正則表達式中的一些使用的符號 # 匹配出現符合條件的 0 次的或者是 多次 str1 = 'qwertyuio1ui3oo467j398k' # 關鍵詞: * 下面的句子就是進行匹配 零次 或者是 多次(多個字符) 符合是數字的意思 pattern = re.compile(r'\d*') res = re.findall(pattern, str1) print(res) """" 顯示的結果: ['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', ''] """ # 關鍵詞: + 匹配一次或者是多次的結果 pattern = re.compile(r'\d+') res = re.findall(pattern, str1) print(res) """ 顯示結果: ['1', '3', '467', '398'] """ # 關鍵詞: ? 匹配0次或者是1次的結果 pattern = re.compile(r'\d?') res = re.findall(pattern, str1) print(res) """ ['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '4', '6', '7', '', '3', '9', '8', '', ''] """ # {m}精確匹配m次 (比如寫進去的3,那么他就是匹配到是3個數字字符串的所有小字符串) pattern = re.compile(r'\d{3}') res = re.findall(pattern, str1) print(res) # 結果:['467', '398'] # {m, n} 最少匹配m次,最多匹配n次 # 記住在{}里面是不能隨便加上空格的? pattern = re.compile(r'\d{1,3}') res = re.findall(pattern, str1) print(res) # 結果:['1', '3', '467', '398'] import re n = re.search('lsp','hhttlsp') if n: print(n.group()) else: print('noneFine') # 顯示結果: # lsp m = re.match('lsp','hhttlsp') if m: print(m.group()) else: print('noneFine') # 顯示結果: # noneFine # 可以使用sub()方法來進行查詢和替換,sub方法的格式為: # sub(replacement, string[, count=0]) # replacement是被替換成的文本 # string是需要被替換的文本 # count是一個可選參數,指最大被替換的數量 # 下面進行將所有的數字給進行替換掉 pattern = re.compile(r'\d') res = re.sub(pattern, '替換掉的數字 ',str1) print(res) # 下文結果,為了方便大家看到換了多少個數字,我使用了換行將字符串給換行看出有幾次換了數字 """ qwertyuio替換掉的數字 ui替換掉的數字 oo替換掉的數字 替換掉的數字 替換掉的數字 j替換掉的數字 替換掉的數字 替換掉的數字 k """ # 加上顯示修改了多少次 res = re.subn(pattern, '替換掉的數字 ',str1) print(res) """ 結果: ('qwertyuio替換掉的數字 ui替換掉的數字 oo替換掉的數字 替換掉的數字 替換掉的數字 j替換掉的數字 替換掉的數字 替換掉的數字 k', 8) """ str2 = '自然語言處理123機器學習456深度學習' pattern = re.compile(r'\d+') res = re.split(pattern, str2) print(res) # 結果: # ['自然語言處理', '機器學習', '深度學習'] str2 = '自然語言處理123機器學習456深度學習' pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)') m = re.search(pattern, str2) print(m.group('dota')) # 結果為: # 123 # 篩選號碼 str3 = 'number 132-3209-*******' pattern = re.compile(r'(\d\d\d-\d\d)') res = re.search(pattern, str3) print(res.group()) # 顯示結果: # 132-32
感謝各位的閱讀,以上就是“python正則表達中的re庫常用方法有哪些”的內容了,經過本文的學習后,相信大家對python正則表達中的re庫常用方法有哪些這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。