您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關怎么在python中利用正則表達式從字符串中提取數字,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。
使用正則表達式,用法如下:
## 總結 ## ^ 匹配字符串的開始。 ## $ 匹配字符串的結尾。 ## \b 匹配一個單詞的邊界。 ## \d 匹配任意數字。 ## \D 匹配任意非數字字符。 ## x? 匹配一個可選的 x 字符 (換言之,它匹配 1 次或者 0 次 x 字符)。 ## x* 匹配0次或者多次 x 字符。 ## x+ 匹配1次或者多次 x 字符。 ## x{n,m} 匹配 x 字符,至少 n 次,至多 m 次。 ## (a|b|c) 要么匹配 a,要么匹配 b,要么匹配 c。 ## (x) 一般情況下表示一個記憶組 (remembered group)。你可以利用 re.search 函數返回對象的 groups() 函數獲取它的值。 ## 正則表達式中的點號通常意味著 “匹配任意單字符”
解題思路:
既然是提取數字,那么數字的形式一般是:整數,小數,整數加小數;
所以一般是形如:----.-----;
根據上述正則表達式的含義,可寫出如下的表達式:"\d+\.?\d*";
\d+匹配1次或者多次數字,注意這里不要寫成*,因為即便是小數,小數點之前也得有一個數字;\.?這個是匹配小數點的,可能有,也可能沒有;\d*這個是匹配小數點之后的數字的,所以是0個或者多個;
代碼如下:
import re string="A1.45,b5,6.45,8.82" print re.findall(r"\d+\.?\d*",string) # ['1.45', '5', '6.45', '8.82']
匹配指定字符串開頭的數字
例如下面的string:
tensorflow:Final best valid 0 loss=0.20478513836860657 norm_loss=0.767241849151384 roc=0.8262403011322021 pr=0.39401692152023315 calibration=0.9863265752792358 rate=0.0 提取 calibration=0.9863265752792358 . # 匹配“calibration=”后面的數字 pattern = re.compile(r'(?<=calibration=)\d+\.?\d*') pattern.findall(string) # ['0.9863265752792358']
匹配包含指定字符串開頭的數字
pattern = re.compile(r'(?:loss=)\d+\.?\d*') pattern.findall(string) # ['loss=0.20478513836860657', 'loss=0.767241849151384']
匹配時間,17:35:24
string = "WARNING:tensorflow: 20181011 15:28:39 Initialize training" pattern = re.compile(r'\d{2}:\d{2}:\d{2}') pattern.findall(string) # ['15:28:39']
匹配時間,20181011 15:28:39
string = "WARNING:tensorflow: 20181011 15:28:39 Initialize training" pattern = re.compile(r'\d{4}\d{2}\d{2}\s\d{2}:\d{2}:\d{2}') pattern.findall(string) # ['20181011 15:28:39']
1、簡單易用,與C/C++、Java、C# 等傳統語言相比,Python對代碼格式的要求沒有那么嚴格;2、Python屬于開源的,所有人都可以看到源代碼,并且可以被移植在許多平臺上使用;3、Python面向對象,能夠支持面向過程編程,也支持面向對象編程;4、Python是一種解釋性語言,Python寫的程序不需要編譯成二進制代碼,可以直接從源代碼運行程序;5、Python功能強大,擁有的模塊眾多,基本能夠實現所有的常見功能。
關于怎么在python中利用正則表達式從字符串中提取數字就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。