1. 程式人生 > >Java 解決Emoji表情過濾問題

Java 解決Emoji表情過濾問題

 

Emoji表情從三方資料中獲取沒有過濾,導致存入DB的時候報錯。

原因:

UTF-8編碼有可能是兩個、三個、四個位元組。Emoji表情是4個位元組,而Mysql的utf8編碼最多3個位元組,所以資料插不進去。

 

 

方法1.將已經建好的表也轉換成utf8mb4

 

2,寫個工具類:過濾掉emoji表情符號


public class EmojiFilter {


private static boolean isEmojiCharacter(char codePoint) {
return (codePoint == 0x0) || (codePoint == 0x9) || (codePoint == 0xA)
|| (codePoint == 0xD)
|| ((codePoint >= 0x20) && (codePoint <= 0xD7FF))
|| ((codePoint >= 0xE000) && (codePoint <= 0xFFFD))
|| ((codePoint >= 0x10000) && (codePoint <= 0x10FFFF));
}

/**
* 過濾emoji 或者 其他非文字型別的字元
*
* @param source
* @return
*/
public static String filterEmoji(String source) {
if (StringUtils.isBlank(source)) {
return source;
}
StringBuilder buf = null;
int len = source.length();
for (int i = 0; i < len; i++) {
char codePoint = source.charAt(i);
if (isEmojiCharacter(codePoint)) {
if (buf == null) {
buf = new StringBuilder(source.length());
}
buf.append(codePoint);
}
}
if (buf == null) {
return source;
} else {
if (buf.length() == len) {
buf = null;
return source;
} else {
return buf.toString();
}
}
}

3,使用別人封裝的一個類,專門解決emoji問題的。這個在git上有開源的程式碼。在pom工程中引入(最方便)

<dependency>
<groupId>com.vdurmont</groupId>
<artifactId>emoji-java</artifactId>
<version>4.0.0</version>
</dependency>