您好,登錄后才能下訂單哦!
小編給大家分享一下python讀txt亂碼怎么辦,相信大部分人都還不怎么了解,因此分享這邊文章給大家學習,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去學習方法吧!
從報錯講起:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 2: illegal multibyte sequence
出現這個錯誤一般是由于打開文件時,沒有指定編碼引起的,比如下面代碼
with open('../corpus.txt', mode = 'r') as f:
解決方法很簡單,為其指定編碼就行了
with open('../corpus.txt', encoding='utf-8', mode = 'r') as f:
還有一個常見的問題就是,生成txt文件,查看內容時發現亂碼,這可能與你在打開文件時沒有指定編碼方式有關
代碼就像這樣
output = open('context.txt', 'w')
解決的方式也很簡單,只要在打開文件時,指定文件編碼就行了
output = open('context.txt', 'w', encoding="utf-8")
以上是python讀txt亂碼怎么辦的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。