1. 程式人生 > >java 用split擷取特殊字元

java 用split擷取特殊字元

在使用String.split方法分隔字串時,分隔符如果用到一些特殊字元,可能會得不到我們預期的結果。

  我們經常使用public String[] split(String regex)方法來拆分一個有分隔符的字串,但是由於引數regex是一個 regular-expression的匹配模式而不是一個簡單的String,所以他對一些特殊的字元可能會出現你預想不到的結果,比如測試下面的程式碼:用豎線 | 分隔字串,你將得不到預期的結果

  view plaincopy to clipboardprint?
  String[] aa = "aaa|bbb|ccc".split("|"); //得不到預期的結果
  //String[] aa = "aaa|bbb|ccc".split("\\|"); 這樣才能得到正確的結果
  for (int i = 0 ; i<aa.length ; i++ ) {
  System.out.println("--"+aa[i]);
  }
  //用豎 * 分隔字串執行將丟擲異常,用加號 + 也是如此。
  String[] aa = "aaa*bbb*ccc".split("*");
  //String[] aa = "aaa|bbb|ccc".split("\\*"); 這樣才能得到正確的結果
  for (int i = 0 ; i<aa.length ; i++ ) {
  System.out.println("--"+aa[i]);
  }


  顯然,+ * 不是有效的模式匹配規則表示式,用"\\*" "\\+"轉義後即可得到正確的結果。

  "|" 分隔串時雖然能夠執行,但是卻不是預期的目的,"\\|"轉義後即可得到正確的結果。

  還有如果想在串中使用"\"字元,則也需要轉義.首先要表達"aaaa\bbbb"這個串就應該用"aaaa\\bbbb",如果要分隔就應該這樣才能得到正確結果:

  String[] aa = "aaa\\bbb\\bccc".split(\\\\);