您好,登錄后才能下訂單哦!
這篇文章主要講解了“用中文API讓正則表達式更易讀寫的方法是什么”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“用中文API讓正則表達式更易讀寫的方法是什么”吧!
Python實現:
標識符:r'\$?[_a-zA-Z\u4e00-\u9fa5][_a-zA-Z0-9\u4e00-\u9fa5]*' 雙引號字符串: r'(\")((?<!\\)\\\1|.)*?\1' 字符串插值相關:r'\\\(([^\\\)]*)\\\)|`([^`]*)`'
由此想到是否有 API 能夠構建正則表達式。找到 PythonVerbalExpressions,它首頁上一個示例如下:
verbal_expression. start_of_line(). find('http'). maybe('s'). find('://'). maybe('www.'). anything_but(' '). end_of_line()
對應正則: ^(http)(s)?(\:\/\/)(www\.)?([^\ ]*)$
看起來的確比較可讀,而且如果改為中文 API 的話,命名會更簡短:
開頭(). 尋找('http'). 或許('s'). 尋找('://'). 或許('www.'). 除了(' '). 結尾()
問題是這個庫的功能似乎有限,僅支持小部分正則語法,于是考慮改進。
以開頭的木蘭實現中的幾個正則為例,用設想中的 API 表達后進行對比
標識符:
至多一個("$").一個("_", 大小寫英文, 中文).任意個("_", 大小寫英文, 數字, 中文) 原始正則表達式對比:r'\$?[_a-zA-Z\u4e00-\u9fa5][_a-zA-Z0-9\u4e00-\u9fa5]*'
雙引號字符串:
分組(雙引號) .最小匹配( 任意個( 分組( 皆可( 前面不是(反斜杠).一個(反斜杠).一個(引用分組(1)), 一個(非換行字符)) ) ) ) .引用分組(1) r'(\")((?<!\\)\\\1|.)*?\1'
字符串插值相關:
皆可( 一個(反斜杠).一個(左小括號).分組(任意個(不是(反斜杠, 右小括號))).一個(反斜杠).一個(右小括號), 一個(反引號).分組(任意個(不是(反引號))).一個(反引號) ) r'\\\(([^\\\)]*)\\\)|`([^`]*)`'
相對原始正則表達式,在可讀性之外還有幾個優勢:
不需為正則的特殊意義字符加反斜杠,如 \,(,) 等
明確運算優先級,比如雙引號字符串中的 | 和 (?<!)...
在易寫方面,相對于正則的符號語法,API 語義更加直白。
感謝各位的閱讀,以上就是“用中文API讓正則表達式更易讀寫的方法是什么”的內容了,經過本文的學習后,相信大家對用中文API讓正則表達式更易讀寫的方法是什么這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。