java中GBK轉UTF-8亂碼如何解決

發布時間：2020-04-29 09:25:25 來源：億速云閱讀：1836 作者：小新欄目：編程語言

今天小編給大家分享的是java中GBK轉UTF-8亂碼如何解決，相信很多人都不太了解，為了讓大家更加了解GBK轉UTF-8亂碼的解決方法，所以給大家總結了以下內容，一起往下看吧。一定會有所收獲的哦。

java中GBK轉UTF-8亂碼的解決方法

如果自己采用的是GBK編碼，對方采用得到是UTF-8編碼，發送數據時需要將GBK編碼數據轉換成UTF-8編碼數據，這樣對方才不會亂碼。

問題出現：GBK轉UTF-8時，奇數個中文會亂碼，偶數個中文不會亂碼。

原因分析：

public static void analyze() throws UnsupportedEncodingException {
String gbk = "我來了";
String utf8 = new String(gbk.getBytes("UTF-8"));
for (byte b : gbk.getBytes("UTF-8")) {
System.out.print(b + " ");
}
System.out.println();
for (byte b : utf8.getBytes()) {
System.out.print(b + " ");
}
}
/*
-26 -120 -111 -26 -99 -91 -28 -70 -122
-26 -120 -111 -26 -99 -91 -28 -70 63 !
*/

注意最后一個字節不同，上面一行才是正確的UTF-8編碼。那么為什么下面一行最后一個字節是63，而不是-122呢？這就是導致亂碼的原因所在。

GBK編碼是一個中文2個字節，而UTF-8編碼是一個中文3個字節，當我們調用getBytes("UTF-8")方法時，會通過計算來增加字節，使得從GBK的2個字節變成UTF-8對應的3個字節。因此，上例3個中文輸出了9個字節。

（）

解決問題

保證字節正確才是硬道理。當調用getBytes("UTF-8")轉換成字節數組后，創建ISO-8859-1編碼的字符串，ISO-8859-1編碼是一個字節對應一個字符，因此不會使最后一個字節錯誤。

public static void correctEncode() throws UnsupportedEncodingException {
String gbk = "我來了";
String iso = new String(gbk.getBytes("UTF-8"),"ISO-8859-1");
for (byte b : iso.getBytes("ISO-8859-1")) {
System.out.print(b + " ");
}
System.out.println();
//模擬UTF-8編碼的網站顯示
System.out.println(new String(iso.getBytes("ISO-8859-1"),"UTF-8"));
}
/*
-26 -120 -111 -26 -99 -91 -28 -70 -122
我來了
*/

關于java中GBK轉UTF-8亂碼如何解決就分享到這里了，希望以上內容可以對大家有一定的參考價值，可以學以致用。如果喜歡本篇文章，不妨把它分享出去讓更多的人看到。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

java中GBK轉UTF-8亂碼如何解決

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

java中GBK轉UTF-8亂碼如何解決

猜你喜歡

最新資訊

相關推薦

相關標簽