在處理中文時,isspace
函數可能會遇到問題,因為中文字符不被視為空白字符。解決方法如下:
def is_whitespace(ch):
if ch.isspace() or ord(ch) == 12288 or ord(ch) in range(8192, 8200):
return True
else:
return False
import re
def is_whitespace(ch):
if re.match(r'[\s\u3000]', ch):
return True
else:
return False
使用上述的自定義函數或正則表達式,可以解決isspace
函數對中文處理的問題。