如何進行Python 中文亂碼問題的分析

發布時間：2021-10-26 15:21:58 來源：億速云閱讀：133 作者：柒染欄目：編程語言

本篇文章給大家分享的是有關如何進行Python 中文亂碼問題的分析，小編覺得挺實用的，因此分享給大家學習，希望大家閱讀完這篇文章后可以有所收獲，話不多說，跟著小編一起來看看吧。

建立一個文件test.txt，文件格式用ANSI，內容為:abc中文用python來讀取

# coding=gbk print open("Test.txt").read()

結果：abc中文把文件格式改成UTF-8這里需要解碼：

# coding=gbk import codecs  print open("Test.txt").read().decode("utf-8")

結果：abc中文上面的test.txt我是用Editplus來編輯的，但當我用Windows自帶的記事本編輯并存成UTF-8格式時，運行時報錯：

Traceback (most recent call last):  
File "ChineseTest.py", line 3, in   
print open("Test.txt").read().decode("utf-8")  
UnicodeEncodeError: 'gbk' codec can't encode 
character u'\ufeff' in position 0: illegal multibyte 
sequence

原來，某些軟件，如notepad，在保存一個以UTF-8編碼的文件時，會在文件開始的地方插入三個不可見的字符（0xEF 0xBB 0xBF，即BOM）。因此我們在讀取時需要自己去掉這些字符，python中的codecs module定義了這個常量：

# coding=gbk import codecs  data = open("Test.txt").read()  if data[:3] == codecs.BOM_UTF8:  datadata = data[3:]  print data.decode("utf-8")

結果：abc中文

以上就是如何進行Python 中文亂碼問題的分析，小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

如何進行Python 中文亂碼問題的分析

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

如何進行Python 中文亂碼問題的分析

猜你喜歡

最新資訊

相關推薦

相關標簽