java 中用正則表示式匹配和提取字串
阿新 • • 發佈:2019-02-05
java.util.regex類支援用正則表示式來匹配和提取字串,讀者可以去官網檢視java.util.regex的詳細使用方法。
首先給出一個匹配字串的例子(判斷line是否符合格式"GraphType\\s*=\\s*\".+\"\\s*"):
public static boolean isLegalInputLine(String line ) { Pattern p =Pattern.compile("GraphType\\s*=\\s*\".+\"\\s*"); Matcher m = p.matcher(line); boolean r =m.matches(); return r; }
這個函式判斷line是否匹配格式"GraphType\\s*=\\s*\".+\"\\*",這裡的格式是使用java的正則表示式語法規則書寫的。具體的語法規則我提供一個網址:https://wenku.baidu.com/view/e109601f52d380eb62946d75.html?rec_flag=default&mark_pay_doc=2&mark_rec_page=1&mark_rec_position=4&mark_rec=view_r_1&clear_uda_param=1
裡面有具體的介紹。
下面給出用正則表示式提取字串的例子(從s中提取匹配格式"GraphType\\s*=\\s*\".+\"\\s*"的字串 ):
public List<String> getString(String s) {
List<String> strs = new ArrayList<String>();
Pattern p = Pattern.compile("GraphType\\s*=\\s*\".+\"\\s*");
Matcher m = p.matcher(s);
while(m.find()) {
strs.add(m.group());
}
return strs;
}
有一款叫做Regex Match Tracer的軟體,可以用它來練習書寫java的正則表示式。值得注意的是這款軟體匹配和提取字串的結果和java中的有所不同,有時這塊軟體不能識別的,java可以識別,筆者就碰到過這種情況。
另外對於學過形式語言與自動機的要注意java的語法規則與形式語言與自動機裡面的正則語法不同。