91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python的正則規則舉例分析

發布時間:2021-11-22 13:45:41 來源:億速云 閱讀:122 作者:iii 欄目:編程語言

這篇文章主要講解了“Python的正則規則舉例分析”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“Python的正則規則舉例分析”吧!

問題復現

我們都知道,Python有個正則規則\w,幾乎所有的網上博客文章都告訴你,這個規則匹配字母數字及下劃線,但實際并不是這樣:

有Python2代碼如下:

~|? pythonPython 2.7.10 (default, Aug 17 2018, 19:45:58)
[GCC 4.2.1 Compatible Apple LLVM 10.0.0 (clang-1000.0.42)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> aa = '捕蛇者說'>>> re.match('\w{1,20}', aa)>>> bb = 'abc123ADB'>>> re.match('\w{1,20}', bb)
<_sre.SRE_Match object at 0x1031b0b28>

我們可以看到,在python2中,\w是無法匹配中文的。那么,同樣的代碼在Python3中運行結果是什么樣子的了?

~|? python3Python 3.7.1 (default, Nov 28 2018, 11:55:14)
[Clang 9.0.0 (clang-900.0.39.2)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> aa = '捕蛇者說'>>> re.match('\w{1,20}', aa)
<re.Match object; span=(0, 4), match='捕蛇者說'>>>> bb = 'abc123ADB'>>> re.match('\w{1,20}', bb)
<re.Match object; span=(0, 9), match='abc123ADB'>

但在Python3中\w是可以匹配中文的,這是怎么回事了?要回答這個問題,我們要回到Python官方文檔中來尋找答案。

解決問題

當我們仔細閱讀Python的官方文檔時,就會發現,對于同樣的正則規則\w,Python2和Python3區別好大,我們先來看看Python2:

When the LOCALE and UNICODE flags are not specified, matches any alphanumeric character and the underscore; this is equivalent to the set [a-zA-Z0-9_]. With LOCALE, it will match the set [0-9_] plus whatever characters are defined as alphanumeric for the current locale. If UNICODE is set, this will match the characters [0-9_] plus whatever is classified as alphanumeric in the Unicode character properties database.

翻譯一下:當沒有設置LOCALE(re.L)和UNICODE(re.U)標志,匹配數字字母和下劃線,如果設置了LOCALE(re.L)則匹配數字下劃線和LOCALE文字。如果設置了UNICODE(re.U)標志,匹配數字下劃線和Unicode字符集里的字符。

那么Python3了:

對于 Unicode (str) 樣式:
匹配Unicode詞語的字符,包含了可以構成詞語的絕大部分字符,也包括數字和下劃線。如果設置了 ASCII 標志,就只匹配 [a-zA-Z0-9_] 。
對于8位(bytes)樣式:
匹配ASCII字符中的數字和字母和下劃線,就是 [a-zA-Z0-9_] 。如果設置了 LOCALE 標記,就匹配當前語言區域的數字和字母和下劃線。

到此,我明白了,默認情況下,不設置任何標志,Python2 \w匹配ASCII字符集里的字符,包括數字字符和下劃線,Python3 \w匹配數字下劃線和Unicode字符集。所以,為了遷移方便,如果你想匹配ASCII字符集里的字符,指定標志為re.A,如果你想匹配Unicode字符集里的字符,指定標志為re.U。

感謝各位的閱讀,以上就是“Python的正則規則舉例分析”的內容了,經過本文的學習后,相信大家對Python的正則規則舉例分析這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

阿坝| 崇阳县| 石嘴山市| 化德县| 西华县| 淮安市| 渭源县| 库伦旗| 石嘴山市| 上蔡县| 新民市| 博湖县| 永清县| 新邵县| 高碑店市| 峨眉山市| 镇坪县| 玛纳斯县| 余姚市| 明溪县| 乌鲁木齐市| 乐东| 东辽县| 侯马市| 马鞍山市| 沾化县| 天门市| 泽库县| 夏邑县| 故城县| 上思县| 阆中市| 乌拉特前旗| 宜宾县| 通州市| 涿州市| 伊川县| 绥中县| 崇州市| 沂水县| 宁河县|