python中文亂碼怎么辦

發布時間：2020-08-13 13:39:51 來源：億速云閱讀：256 作者：小新欄目：編程語言

這篇文章將為大家詳細講解有關python中文亂碼怎么辦，小編覺得挺實用的，因此分享給大家做個參考，希望大家閱讀完這篇文章后可以有所收獲。

1、demo.py 文件和編碼聲明都為 GBK

這種方法比較笨，就是把 demo.py 文件改為 GBK 存儲，而且編碼聲明也是GBK，個人不推薦。

python學習網，大量的免費python視頻教程，歡迎在線學習！

# encoding:gbk
s = "中文"
print s
print repr(s)

2、中文用 unicode 表示

只要在中文前面加上個小u標記，后面的中文就用 unicode 存儲了。

# encoding:utf-8
s = u"中文"
print s
print repr(s)

cmd 下是可以打印 unicode 字符的，如下：

python中文亂碼怎么辦

3、把中文強制轉換為GBK或者unicode編碼

強制轉換為unicode編碼，在 Python 中編碼是可以互相轉換的，比如從utf-8轉換為gbk，不同編碼之間不能直接轉換，需要通過unicode字符集中間過渡下，從上面基礎知識可知unicode是一種字符集，不屬于編碼，而utf-8是具體實現unicode思想的一種編碼。utf-8轉換為unicode是一種解碼過程，通過decode可從utf-8解碼成unicode。

# encoding:utf-8
s = "中文"
u = s.decode('utf-8')
print u
print type(u)
print repr(u)

python中文亂碼怎么辦

強制轉換為gbk編碼，上一步已經從utf-8轉換為unicode了，從unicode是編碼的過程，通過encode實現。

# encoding:utf-8
s = "中文"
u = s.decode('utf-8')
g = u.encode('gbk')
print g
print type(g)
print repr(g)

總結

windows cmd 窗口下不支持utf-8，想要顯示中文必須轉換為gbk或者unicode，而 Python idle 中這三種編碼都支持。中文亂碼的出現都是由于編碼不一致導致的，存儲的是用utf-8，打印的時候用gbk就會亂碼了，所有要保證不亂碼盡量保持統一，建議全部使用unicode。

decode 解碼

從其它編碼變成unicode叫解碼，解碼用的方法是decode，第一個參數為被解碼的字符串原始編碼格式，如果寫錯了也會報錯。比如 s 是utf-8，用gbk去解碼就會報錯。

# encoding:utf-8
s = "中文"
u = s.decode('gbk')
print u
print repr(u)

小提示

在 Python idle 和 cmd 下直接輸入 s = "中文"會以 gbk 編碼的，如果在文件中輸入 s = "中文"且文件存儲格式為utf-8，那么 s 是以utf-8編碼存儲的，有點不一樣曾經踩過坑，及時 Python idle 成功了文件運行的時候也可能失敗。

encode 編碼

不可以直接從utf-8轉換為gbk，必須經過unicode中間轉換，這點很重要，被編碼的原始字符串一定要為unicode，否則會報錯。

raw_input

raw_input 是獲取用戶輸入值的，獲取到的用戶輸入值和當前運行環境編碼有關，比如 cmd 下默認編碼是 gbk，那么輸入的漢字就是以gbk編碼，而不管 demo.py 文件編碼格式和編碼聲明。

# encoding:utf-8
s = raw_input("input something: ")
print s
print type(s)
print repr(s)

python中文亂碼怎么辦

GBK 編碼一個漢字兩個字節，UTF-8 一個漢字通常3個字節。

細心的朋友已經注意了，raw_input的提示語我用的是英文，那改成中文看看，果真出現亂碼了。

# encoding:utf-8
s = raw_input("請輸入中文漢字：")
print s
print type(s)
print repr(s)

python中文亂碼怎么辦

怎么辦呢？把提示字符串強制為gbk編碼就好，unicode和utf-8都不可以。

# encoding:utf-8
s = raw_input(u"請輸入中文漢字：".encode('gbk'))
print s
print type(s)
print repr(s)

相等陷阱

“中文”這兩個字符串用不同的編碼存儲是不一樣的，utf-8編碼和gbk編碼存儲的“中文”都不一樣。

python中文亂碼怎么辦

總結

想要不亂碼，記住以下5點法則：

（1）文件存儲為utf-8格式，編碼聲明為utf-8，# encoding:utf-8。

（2）出現漢字的地方前面加 u。

（3）不同編碼之間不能直接轉換，要經過unicode中間跳轉。

（4）cmd 下不支持utf-8編碼。

（5）raw_input提示字符串只能為gbk編碼。

關于python中文亂碼怎么辦就分享到這里了，希望以上內容可以對大家有一定的幫助，可以學到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

python中文亂碼怎么辦

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

python中文亂碼怎么辦

猜你喜歡

最新資訊

相關推薦

相關標簽