您好,登錄后才能下訂單哦!
這篇文章主要為大家詳細介紹了怎么在Python中將二進制串轉換為通用字符串,文中示例代碼介紹的非常詳細,具有一定的參考價值,發現的小伙伴們可以參考一下:
Python是一種編程語言,內置了許多有效的工具,Python幾乎無所不能,該語言通俗易懂、容易入門、功能強大,在許多領域中都有廣泛的應用,例如最熱門的大數據分析,人工智能,Web開發等。
Python代碼的編碼規則為UTF-8。在讀入時,文件的每行是二進制串,形如:
b'heroes\xff.....
在對每行進一步進行處理時,要求處理對象必須為通用字符串,所以:
lineVec = str(line).strip().split('\t')
此時的lineVec的元素類型為string,但輸出是仍然是 “b'heros\xff…..” ,仍然無法擺脫二進制標志的影響。然而,尷尬的是,在后邊對以lineVec元素作為鍵的字典進行索引時,只能獲得通用字符串的鍵。所以,每次索引都以KeyError退出。
在多次嘗試之后,我發現:二進制串在經過str()函數轉化之后,已經將所有的內容都轉化成了一個通用的字符串。也就是說,“b'heros\xff……”中的所有字符都是可以用python的字符串處理手段處理的。
給定一個 word=”b'heros”,如果希望得到通用字符串形式的單詞”heros”,那么我們可以直接取字符串word的第3至最后一個字母,或將“b'”直接替換掉:
newWord = word[2:-1] #或 newWord = word.replace("b'",'') #因為單引號是python中表示字符串的特殊功能字符,所以被替換的字
符寫作'b''會報錯。需要用雙引號把單引號括起來。
在用上面的方法把字典鍵都更新了一遍之后,世界瞬間和諧了。
一些擴充
在解決上邊的問題的過程中,搜索了許多相關的解決方法,對python中二進制串與通用字符串之間的轉換有了一定的了解。但都是關于純英語字符串轉換的,對上邊的中文字符無用。用下面方法轉換中文字符串時會出現編碼錯誤。
給定通用字符串 string = ‘a string' , 需要把它轉換為二進制串時,可以直接調用字符串的內置方法:
print string >>>a string bstring = string.encode('ascii') # encode方法,參數用來指定編碼標準 print bstring >>>b'a string' string1 = bstring.decode('ascii') # encode的逆,對二進制串進行解碼 print string1 >>>a string
以上就是億速云小編為大家收集整理的怎么在Python中將二進制串轉換為通用字符串,如何覺得億速云網站的內容還不錯,歡迎將億速云網站推薦給身邊好友。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。