您好,登錄后才能下訂單哦!
本篇內容主要講解“python3里gbk編碼的問題如何解決”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“python3里gbk編碼的問題如何解決”吧!
在python3有關字符串的處理當中,經常會遇到
'gbk' codec can't encode character '\xa0'
這個問題,原因是在str里面存在著不能正確編碼的字符。
通過以下方法即可解決。
import requests from bs4 import BeautifulSoup url = "http://jecvay.com/2015/03/learning-compilers-1.html" url = url.encode('gbk','ignore').decode('utf-8') //忽略 response = requests.get(url) print(response) soup = BeautifulSoup(response.text) print(soup.body.text)
以上方法在必須要記錄數據的時候會出現數據不準確問題
python3 字符串無法將 gbk 完全轉換為utf8
對于必須存儲的情況,將gbk -> 十六進制字節碼文本 保存,需要的時候在轉換為gbk以便顯示。
def string_hex(data): lin = ['%02X' % i for i in data] return "".join(lin).upper() def __ToUTF8(tuple): lists = [] for itme in tuple: tmp = itme if type(itme) == bytes: try: tmp = itme.decode('gbk') except UnicodeDecodeError: tmp = string_hex(itme) lists.append(tmp) return lists
def readFileAll(file): with open(file, 'rb') as f: data = f.read() return data
s = readFileAll('gkb.txt') //gbk 字符串文件 sx = string_hex(s)//轉化為16進制文本 print(sx)
到此,相信大家對“python3里gbk編碼的問題如何解決”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。