您好,登錄后才能下訂單哦!
本文章向大家介紹使用Java怎么將String字符串和Unicode字符進行轉換,主要包括使用Java怎么將String字符串和Unicode字符進行轉換的使用實例、應用技巧、基本知識點總結和需要注意事項,具有一定的參考價值,需要的朋友可以參考一下。
Java是一門面向對象編程語言,可以編寫桌面應用程序、Web應用程序、分布式系統和嵌入式系統應用程序。
字符串轉換unicode java方法代碼片段:
/** * 字符串轉換unicode * @param string * @return */ public static String string2Unicode(String string) { StringBuffer unicode = new StringBuffer(); for (int i = 0; i < string.length(); i++) { // 取出每一個字符 char c = string.charAt(i); // 轉換為unicode unicode.append("\\u" + Integer.toHexString(c)); } return unicode.toString(); }
unicode轉換字符串java方法代碼片段:
/** * unicode 轉字符串 * @param unicode 全為 Unicode 的字符串 * @return */ public static String unicode2String(String unicode) { StringBuffer string = new StringBuffer(); String[] hex = unicode.split("\\\\u"); for (int i = 1; i < hex.length; i++) { // 轉換出每一個代碼點 int data = Integer.parseInt(hex[i], 16); // 追加成string string.append((char) data); } return string.toString();
結合正則實現的代碼:
混有普通字符的Unicode轉換為字符串:
/** * 含有unicode 的字符串轉一般字符串 * @param unicodeStr 混有 Unicode 的字符串 * @return */ public static String unicodeStr2String(String unicodeStr) { int length = unicodeStr.length(); int count = 0; //正則匹配條件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}"; String regex = "\\\\u[a-f0-9A-F]{1,4}"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(unicodeStr); StringBuffer sb = new StringBuffer(); while(matcher.find()) { String oldChar = matcher.group();//原本的Unicode字符 String newChar = unicode2String(oldChar);//轉換為普通字符 // int index = unicodeStr.indexOf(oldChar); // 在遇見重復出現的unicode代碼的時候會造成從源字符串獲取非unicode編碼字符的時候截取索引越界等 int index = matcher.start(); sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符 sb.append(newChar);//添加轉換后的字符 count = index+oldChar.length();//統計下標移動的位置 } sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符 return sb.toString(); }
完整代碼:
package util; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * * <p>Title: String 與 Unicode 互相轉換的工具類</p> * <p>Description: </p> * <p>Company: SCAU@Copyright</p> * @Copyright 1.0 * @author jodenhe (824923282@qq.com) * @version 1.0 * @since 2017年8月17日 下午9:42:50 */ public class StringUnicodeUtil { /** * 含有unicode 的字符串轉一般字符串 * @param unicodeStr 混有 Unicode 的字符串 * @return */ public static String unicodeStr2String(String unicodeStr) { int length = unicodeStr.length(); int count = 0; //正則匹配條件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}"; String regex = "\\\\u[a-f0-9A-F]{1,4}"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(unicodeStr); StringBuffer sb = new StringBuffer(); while(matcher.find()) { String oldChar = matcher.group();//原本的Unicode字符 String newChar = unicode2String(oldChar);//轉換為普通字符 // int index = unicodeStr.indexOf(oldChar); // 在遇見重復出現的unicode代碼的時候會造成從源字符串獲取非unicode編碼字符的時候截取索引越界等 int index = matcher.start(); sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符 sb.append(newChar);//添加轉換后的字符 count = index+oldChar.length();//統計下標移動的位置 } sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符 return sb.toString(); } /** * 字符串轉換unicode * @param string * @return */ public static String string2Unicode(String string) { StringBuffer unicode = new StringBuffer(); for (int i = 0; i < string.length(); i++) { // 取出每一個字符 char c = string.charAt(i); // 轉換為unicode unicode.append("\\u" + Integer.toHexString(c)); } return unicode.toString(); } /** * unicode 轉字符串 * @param unicode 全為 Unicode 的字符串 * @return */ public static String unicode2String(String unicode) { StringBuffer string = new StringBuffer(); String[] hex = unicode.split("\\\\u"); for (int i = 1; i < hex.length; i++) { // 轉換出每一個代碼點 int data = Integer.parseInt(hex[i], 16); // 追加成string string.append((char) data); } return string.toString(); } public static void main(String[] args) { String str = "abc"; String str2 = string2Unicode(str); System.out.println(str2); System.out.println(unicodeStr2String(str2)); System.out.println(unicodeStr2String("\\u61HJ\\u62\\u63(sfkfdsl)")); } }
代碼運行結果圖:
重要代碼講解:
代碼的實現其實很簡單,因此只對核心主要代碼進行講解,如對代碼有疑惑可私信或留下評論!
1、正則匹配規則:
String regex = \\\\u[a-f0-9A-F]{1,4};
這個是正則匹配的規則,可能你會疑惑為什么使用“\\\\u”來匹配javan字符串的“\\u”,原因很簡單,因為這樣才匹配得上嘛(開個玩笑)直接看測試圖1-2
測試圖1:
測試圖2:
很明顯在菜鳥上使用兩種匹配方式匹配到的結果是不同的,而java字符串需要轉義,上圖的“\u”java就應該是“\\u”,因此就要使用“\\\\u”來進行匹配!
[a-f0-9A-F]{1,4}
”[a-f0-9A-F]“ :這個意思就是a到f,0到9,A到F出現的數都符合要求,“{1,4}”意思是前面的字符出現1到4個(其實一般的Unicode都是“\u”后面家4個字符的,如“\u0061”代表“a”,因此該式子可改為“\\\\u[a-f0-9A-F]{4}”,這樣可能更符合實際要求)
到此這篇關于使用Java怎么將String字符串和Unicode字符進行轉換的文章就介紹到這了,更多相關的內容請搜索億速云以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持億速云!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。