在Java中檢查字符串的編碼格式可以通過以下步驟實現:
getBytes()
方法將字符串轉換為字節數組。Charset.forName()
方法創建一個指定編碼格式的字符集對象。decode()
方法將字節數組解碼為字符串。下面是一個示例代碼:
import java.nio.charset.Charset;
import java.nio.charset.StandardCharsets;
import java.util.Arrays;
public class Main {
public static void main(String[] args) {
String str = "Hello, 你好";
// 將字符串轉換為字節數組
byte[] bytes = str.getBytes(StandardCharsets.UTF_8);
// 檢查常見的編碼格式
checkEncoding(bytes, "UTF-8");
checkEncoding(bytes, "GBK");
checkEncoding(bytes, "ISO-8859-1");
}
private static void checkEncoding(byte[] bytes, String charsetName) {
Charset charset = Charset.forName(charsetName);
String decodedStr = charset.decode(Arrays.copyOf(bytes, bytes.length)).toString();
if (decodedStr.equals(new String(bytes, charset))) {
System.out.println("String encoding is: " + charset.displayName());
}
}
}
在上面的示例中,我們檢查了字符串在UTF-8、GBK和ISO-8859-1編碼格式下是否能正確解碼,如果解碼后的字符串和原始字符串相同,則輸出字符串的編碼格式。您可以根據需要修改示例代碼以檢查其他編碼格式。