您好,登錄后才能下訂單哦!
java中怎么截取中英文混合字符,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
題目:
編寫一個截取字符串的函數,輸入為一個字符串和字節數,輸出為按字節截取的字符串。 但是要保證漢字不被截半個,如“我ABC”4,應該截為“我AB”,輸入“我ABC漢DEF”,6,應該輸出為“我ABC”而不是“我ABC+漢的半個”。
如果是charset(gb2312, GBK, BIG5), 漢字占兩個字節,問題的關鍵在于考慮截取長度的最后一個字節,如果是屬于一個漢字的第一個字節,忽略即可,而漢字每個字節前都是1,所以都是負數,采用if(byte[i]<0)判斷是否是漢字的最后一個字節。
目前看到的最好的辦法:
import java.io.UnsupportedEncodingException;public class StringSpliter { static void fun1(String str, int length) throws UnsupportedEncodingException { // System.out.println(str.getBytes().length); byte[] bt = str.getBytes("gbk"); for (int i = 0; i < bt.length; i++) { // 打印出字節數組中的值,可以看出只要是漢字[采用GBK編碼時占兩個字節/UTF-8占3個字節],并且為兩個負整數 // 由于字節的第一位都是1,所以它就是由負數來表示的 System.out.println(bt[i]); } // 打印出按實際出入的字節數的所截字符串 // System.out.println(new String(bt,0,length)); // 判斷最后一個是否為負,如果是負的則丟掉該字節 if (bt[length] < 0) { System.out.println(new String(bt, 0, --length, "gbk")); } else { System.out.println(new String(bt, 0, length, "gbk")); } } public static void main(String[] args) { // StringSpliter.fun1("我ABC", 4); try { StringSpliter.fun1("我ABC漢DEF", 7); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e.printStackTrace(); } }}
關于java中怎么截取中英文混合字符問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。