您好,登錄后才能下訂單哦!
小編給大家分享一下python3匹配中文的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
Python re正則匹配中文,其實非常簡單,把中文的unicode字符串轉換成utf-8格式就可以了,然后可以在re中隨意調用。
unicode中中文的編碼為/u4e00-/u9fa5,因此正則表達式u”[\u4e00-\u9fa5]+”可以表示一個或者多個中文字符。
>>> import re >>> s='中文:123456aa哈哈哈bbcc'.decode('utf8') >>> s u'\u4e2d\u6587\uff1a123456aa\u54c8\u54c8\u54c8bbcc' >>> print s 中文:123456aa哈哈哈bbcc >>> re.match(u"[\u4e00-\u9fa5]+",s) <_sre.SRE_Match object at 0xb77742c0> >>> pat='中文'.decode("utf8") >>> re.search(pat,s) <_sre.SRE_Match object at 0x16a16df0> >>> newpat='這里是中文內容'.decode("utf8") >>> news=re.sub(pat,newpat,s) >>> print news 這里是中文內容:123456aa哈哈哈bbcc
看完了這篇文章,相信你對python3匹配中文的方法有了一定的了解,想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。