您好,登錄后才能下訂單哦!
正則表達式是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規則字符串”,這個“規則字符串”用來表達對字符串的一種過濾邏輯。
正則表達式的字符串表達方法根據不同的嚴謹程度與功能分為基本正則表達式與擴展正則表達式。基礎正則表達式是常用的正則表達式的最基礎的部分。在 Linux 系統中常見的文件處理工具中 grep 與 sed 支持基礎正則表達式,而 egrep 與 awk 支持擴展正則表達式。
1)查找特定字符
-n:顯示行號 -i:不區分大小寫
查找出目標文件中帶有“the”的字符
[root@localhost conf]# grep -n 'the' httpd.conf
若反向查找,查找不包含“the”字符的行,則需要通過“-vn”選項實現
[root@localhost conf]# grep -vn 'the' httpd.conf
2)利用中括號“[ ]”來查找集合字符(先創建一個自定義的文本文件a.txt)
想要查找“shirt”與“short”這兩個字符串時,可以發現這兩個字符串均包含“sh” 與“rt”。此時執行以下命令即可同時查找到“shirt”與“short”這兩個字符串。“[]”中無論有幾個字符,都僅代表一個字符,也就是說“[io]”表示匹配“i”或者“o”。
#a.txt實驗文本
short
shirt
oo
tools
wood
woooooood
Wood
the football
this the web
123123
456456.
[root@localhost ~]# grep -n 'sh[io]rt' a.txt
若要查找包含重復單個字符“oo”時,只需要執行以下命令即可
[root@localhost ~]# grep -n 'oo' a.txt
若查找“oo”前面不是“w”的字符串,只需要通過集合字符的反向選擇“[^]”來實現該目的
[root@localhost ~]# grep -n '[^w]oo' a.txt
在上述命令的執行結果中發現“wooooood”也符合匹配規則,包含“w”。其實通過執行結果就可以看出,符合匹配標準的字符加粗顯示,而上述結果中可以得知,“#wooooood #”中加粗顯示的是“oooooo”,而“oo”前面的“o”是符合匹配規則的。
若不希望“oo”前面存在小寫字母a-z A-Z 數字0-9
[root@localhost ~]# grep -n '[^a-z]oo' a.txt
3)查找行首“^”與行尾字符“$”
基礎正則表達式包含兩個定位元字符:“^”(行首)與“$”(行尾)。在上面的示例中,查詢“the”字符串時出現了很多包含“the”的行,如果想要查詢以“the”字符串為行首的行,則可以通過“^”元字符來實現。
[root@localhost ~]# grep -n '^the' test.txt
查詢以小寫字母開頭的行可以通過“^[a-z]”規則來過濾,查詢大寫字母開頭的行則使用“^[A-Z]”規則,若查詢不以字母開頭的行則使用“^[^a-zA-Z]”規則。
[root@localhost ~]# grep -n '^[^a-zA-Z]' a.txt
“^”符號在元字符集合“[]”符號內外的作用是不一樣的,在“[]”符號內表示反向選擇,在“[]”符號外則代表定位行首。反之,若想查找以某一特定字符結尾的行則可以使用“$”定位符。例如,執行以下命令即可實現查詢以小數點(.)結尾的行。因為小數點(.) 在正則表達式中也是一個元字符(后面會講到),所以在這里需要用轉義字符“\”將具有特 殊意義的字符轉化成普通字符。空行使用^$即可。
[root@localhost ~]# grep -n '\.$' a.txt
4)查找任意一個字符“.”與重復字符“*”
前面提到,在正則表達式中小數點(.)也是一個元字符,代表任意一個字符。例如, 執行以下命令就可以查找“w??d”的字符串,即共有四個字符,以 w 開頭 d 結尾。
在上述結果中,“wood”字符串“w..d”匹配規則。若想要查詢 oo、ooo、ooooo 等資料,則需要使用星號()元字符。但需要注意的是,“”代表的是重復零個或多個前面的單字符。
[root@localhost ~]# grep -n 'oo*' a.txt
查詢以 w 開頭 d 結尾,中間的字符可有可無的字符串。
[root@localhost ~]# grep -n 'w.d' a.txt
查詢任意數字所在行。
[root@localhost ~]# grep -n '[0-9][0-9]' a.txt
5)查找連續字符范圍“{}”
查詢以 w 開頭以 d 結尾,中間包含 2~5 個 o 的字符串。
[root@localhost ~]# grep -n 'wo{2,5}d' a.txt
查詢以 w 開頭以 d 結尾,中間包含 2 個 o 以上的字符串。
[root@localhost ~]# grep -n 'wo{2,}d' a.txt
通常情況下會使用基礎正則表達式就已經足夠了,但有時為了簡化整個指令,需要使用范圍更廣的擴展正則表達式。
grep 命令僅支持基礎正則表達式,如果使用擴展正則表達式,需要使用 egrep 或 awk 命令。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。