您好,登錄后才能下訂單哦!
了解Python3編碼類型如何轉換?這個問題可能是我們日常學習或工作經常見到的。希望通過這個問題能讓你收獲頗深。下面是小編給大家帶來的參考內容,讓我們一起來看看吧!
1.Python和unicode
為了正確處理多語言文本,Python在2.0版后引入了Unicode字符串。
2.python中的print
雖然python內部需要將文本編碼轉換為unicode編碼來處理,而終端顯示工作則由傳統的Python字符串完成(實際上,Python的print語句根本無法打印出雙字節的Unicode編碼字符)。
python的print會對輸出的unicode編碼(對其它非unicode編碼,print會原樣輸出)做自動的編碼轉換(輸出到控制臺時),而文件對象的write方法就不會做,因此,當一些字符串用print輸出正常時,write到文件確不一定和print的一樣。
在linux下是按照環境變量來轉換的,在linux下使用locale命令就可以看到。print語句它的實現是將要輸出的內容傳送了操作系統,操作系統會根據系統的編碼對輸入的字節流進行編碼。
>>>str='學習python' >>> str '\xe5\xad\xa6\xe4\xb9\xa0python' #asII編碼 >>> print str 學習python >>> str=u'學習python' >>> str ####unicode編碼 '\xe5u\xad\xa6\xe4\xb9\xa0python'
3. python中的decode
將其他字符集轉化為unicode編碼(只有中文字符才需要轉換)
>>> str='學習' >>> ustr=str.decode('utf-8') >>> ustr u'\u5b66\u4e60'
這樣就對中文字符進行了編碼轉換,可用python進行后續的處理;(如果不轉換的話,python會根據機器的環境變量進行默認的編碼轉換,這樣就可能出現亂碼)
4.python中的encode
將unicode轉化為其它字符集
>>> str='學習' >>> ustr=str.decode('utf-8') >>> ustr u'\u5b66\u4e60' >>> ustr.encode('utf-8') '\xe5\xad\xa6\xe4\xb9\xa0' >>> print ustr.encode('utf-8')
感謝各位的閱讀!看完上述內容,你們對Python3編碼類型如何轉換大概了解了嗎?希望文章內容對大家有所幫助。如果想了解更多相關文章內容,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。