您好,登錄后才能下訂單哦!
本篇內容介紹了“Python中文問題舉例分析”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
在這之前,我們先要了解Python中有兩種字符串,分別是一般的字符串(每個字符用8 bits表示)和Unicode字符串(每個字符用一個或者多個字節表示)。
它們可以相互轉換,有著更為全面的描述,在此我就不再多說什么了。來看下面的代碼:
# -*- coding:gb2312 -*- #必須在***行或者第二行 print "-------------code 1----------------" a = "中文a我愛你" print a print a.find("我") b = a.replace("愛", "喜歡") print b print "--------------code 2----------------" x = "中文a我愛你" y = unicode(x, "gb2312") print y.encode("gb2312") print y.find(u"我") z = y.replace(u"愛", u"喜歡") print z.encode("gb2312") print "---------------code 3----------------" print y
說是遇到非ASCII字符了,并讓我們參考pep-0263。PEP-0263(Python Enhancement Proposal)上面說得很清楚了,Python也意識到了國際化問題,并提出了解決方案。根據提案上面的要求,我們有如下代碼:
-------------code 1---------------- 中文a我愛你 5 中文a我喜歡你 --------------code 2---------------- 中文a我愛你 3 中文a我喜歡你 ---------------code 3---------------- Traceback (most recent call last): File "G:\Downloads\eclipse\workspace\p\src\hello.py", line 16, in <module> print y UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)
我們可以看到,通過引入Python中文問題聲明,我們可以正常地在使用中文了,而且在code 1和2中,控制臺也能正確的把中文打印出來。但是,很明顯,上面的代碼也反映出了不少的問題:
1、code 1 和 2在使用print時采用了不同的方式,1是直接print,而2在print之前先進行編碼
2、code 1 和 2中在同樣的字符串查找同一個字符“我”,得出的結果不一樣(分別是5和3)
3、code 3 中直接打印unicode字符串 y時出現錯誤(這也是為什么code 2中要先進行編碼的原因)
“Python中文問題舉例分析”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。