1. 程式人生 > >java unicode與字串轉換

java unicode與字串轉換

package util;  
  
import java.util.regex.Matcher;  
import java.util.regex.Pattern;  
  
/** 
 *  
 * <p>Title: String 與 Unicode 互相轉換的工具類</p> 
 * <p>Description: </p> 
 * <p>Company: [email protected]</p> 
 * @Copyright 1.0 
 * @author jodenhe ([email protected]
) * @version 1.0 * @since 2017年8月17日 下午9:42:50 */ public class StringUnicodeUtil { /** * 含有unicode 的字串轉一般字串 * @param unicodeStr 混有 Unicode 的字串 * @return */ public static String unicodeStr2String(String unicodeStr) { int length = unicodeStr.length(); int count = 0; //正則匹配條件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}"; String regex = "\\\\u[a-f0-9A-F]{1,4}"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(unicodeStr); StringBuffer sb = new StringBuffer(); while(matcher.find()) { String oldChar = matcher.group();//原本的Unicode字元 String newChar = unicode2String(oldChar);//轉換為普通字元 int index = unicodeStr.indexOf(oldChar); sb.append(unicodeStr.substring(count, index));//新增前面不是unicode的字元 sb.append(newChar);//新增轉換後的字元 count = index+oldChar.length();//統計下標移動的位置 } sb.append(unicodeStr.substring(count, length));//新增末尾不是Unicode的字元 return sb.toString(); } /** * 字串轉換unicode * @param string * @return */ public static String string2Unicode(String string) { StringBuffer unicode = new StringBuffer(); for (int i = 0; i < string.length(); i++) { // 取出每一個字元 char c = string.charAt(i); // 轉換為unicode unicode.append("\\u" + Integer.toHexString(c)); } return unicode.toString(); } /** * unicode 轉字串 * @param unicode 全為 Unicode 的字串 * @return */ public static String unicode2String(String unicode) { StringBuffer string = new StringBuffer(); String[] hex = unicode.split("\\\\u"); for (int i = 1; i < hex.length; i++) { // 轉換出每一個程式碼點 int data = Integer.parseInt(hex[i], 16); // 追加成string string.append((char) data); } return string.toString(); } public static void main(String[] args) { String str = "abc"; String str2 = string2Unicode(str); System.out.println(str2); System.out.println(unicodeStr2String(str2)); System.out.println(unicodeStr2String("\\u61HJ\\u62\\u63(sfkfdsl)")); } }

正則轉換unicode轉換為字串

public static String unicodeToString(String str) {

	    Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))");

	    Matcher matcher = pattern.matcher(str);

	    char ch;

	    while (matcher.find()) {

	        ch = (char) Integer.parseInt(matcher.group(2), 16);

	        str = str.replace(matcher.group(1), ch+"" );

	    }

	    return str;

	}

原文連結:https://blog.csdn.net/u013066244/article/details/54708179