1. 程式人生 > >java 中用正則表示式匹配和提取字串

java 中用正則表示式匹配和提取字串

java.util.regex類支援用正則表示式來匹配和提取字串,讀者可以去官網檢視java.util.regex的詳細使用方法。

首先給出一個匹配字串的例子(判斷line是否符合格式"GraphType\\s*=\\s*\".+\"\\s*"):

public static boolean isLegalInputLine(String line )   {

        Pattern p =Pattern.compile("GraphType\\s*=\\s*\".+\"\\s*");
     	Matcher m = p.matcher(line);
    	boolean r =m.matches(); 
    
    	return r;
    	
    }

這個函式判斷line是否匹配格式"GraphType\\s*=\\s*\".+\"\\*",這裡的格式是使用java的正則表示式語法規則書寫的。具體的語法規則我提供一個網址:https://wenku.baidu.com/view/e109601f52d380eb62946d75.html?rec_flag=default&mark_pay_doc=2&mark_rec_page=1&mark_rec_position=4&mark_rec=view_r_1&clear_uda_param=1
裡面有具體的介紹

下面給出用正則表示式提取字串的例子(從s中提取匹配格式"GraphType\\s*=\\s*\".+\"\\s*"的字串

):

public List<String> getString(String s) {

   List<String> strs = new ArrayList<String>();
   Pattern p = Pattern.compile("GraphType\\s*=\\s*\".+\"\\s*");
   Matcher m = p.matcher(s);
   while(m.find()) {
     strs.add(m.group());

   }
   return strs;
}

有一款叫做Regex Match Tracer的軟體,可以用它來練習書寫java的正則表示式。值得注意的是這款軟體匹配和提取字串的結果和java中的有所不同,有時這塊軟體不能識別的,java可以識別,筆者就碰到過這種情況。

另外對於學過形式語言與自動機的要注意java的語法規則與形式語言與自動機裡面的正則語法不同。