1. 程式人生 > >java中使用Pattern類中和Matcher類進行查詢和替換,你會嗎?

java中使用Pattern類中和Matcher類進行查詢和替換,你會嗎?

前言

無論是哪一門語言,我們總會用到正則表示式來進行字串的查詢和替換。Java中也不為過,我曾經寫過一個網頁---正則表示式線上測試。那時候,我還沒有開始學習Java,不知道Java支援正則表示式,所以我的第一個方案是想辦法將資料傳輸到後臺,然後利用Shell指令碼正則表示式得到匹配結果。如果後來真的那麼做了,那就二了。後來我研究了以下別的類似的網站,發現甚至連js檔案都不用寫,直接將函式寫在html檔案中就能夠完成這一個任務。一天的時間,我把這個網站給寫了出來。所以,即使不是指令碼型語言,瞭解以下正則表示式總是有好處的。不過,本文不會贅述那些正則表示式的語法,不清楚的同學可以直接去API文件裡面查檢視。本文主要介紹用用Pattern類和Matcher類中用於查詢和替換的一些方法,因為這些方法之間很容易混淆,所以分享一下,歡迎拍磚。

基本用法

Pattern類和Matcher類使用的基本流程:1.匯入java.util.regex包;2.根據你的string生成一個Pattern物件引用,例如string str = "abc+",  Pattern p = Pattern.compile(str);3.呼叫Pattern的matcher方法,傳入帶匹配的字串,生成Matcher物件引用;4.呼叫matcher類的諸多方法去實現查詢和替換等功能。如下例所示:
import java.util.regex.*;


public class TestRegularExpression {
  public static void main(String[] args) {
    String strCharSequence = "abcabcabcdefabc";
    String strRegex = "(abc)+";
    Pattern p = Pattern.compile(strRegex);
    Matcher m = p.matcher(strCharSequence);
    while(m.find()) {
    <span style="white-space:pre">	</span>System.out.println("Match \"" + m.group() + "\" at positions " +
        m.start() + "-" + (m.end() - 1));
    }
  }
}
輸出結果:
Match "abcabcabc" at positions 0-8
Match "abc" at positions 12-14
程式說明:這個程式在字串abcabcabcdefabc通過正則表示式(abc)+進行匹配。並且利用了matcher.find()函式進行查詢,現在就只需要知道find()函式能進行多次匹配就好了,matcher.group()方法能返回匹配的整個匹配結果,start()函式返回匹配位置的起始索引,end()方法返回所匹配的最後字元加1的值。下面我們詳細地介紹一下有關於查詢的幾個常用的方法matches,lookingAt和find的區別。

查詢

  • matches()方法用來用來判斷整個字串是否匹配正則表示式,只有全部都匹配的時候才會返回true,否則返回false。但如果是部分匹配的話,則會移動匹配的開始的位置;
  • lookingAt()方法部分匹配,總是從第一個字元進行匹配,匹配成功了不再繼續匹配,匹配失敗了,也不繼續匹配;
  • find()方法,部分匹配,從當前位置開始匹配,找到一個匹配的子串,將移動下次匹配的位置;
  • reset()方法,將當前開始匹配的位置重新設定到左邊最開始的位置。
可以結合下面的例子進行理解。
import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
public class IOTest {
	public static void main(String[] args){
		Pattern pattern = Pattern.compile("\\d{3,5}");
		String charSequence = "123-34345-234-00";
		Matcher matcher = pattern.matcher(charSequence);
 
		//雖然匹配失敗,但由於charSequence裡面的"123"和pattern是匹配的,所以下次的匹配從位置4開始
		print(matcher.matches());
		//測試匹配位置
		matcher.find();
		print(matcher.start());
 
		//使用reset方法重置匹配位置
		matcher.reset();
 
		//第一次find匹配以及匹配的目標和匹配的起始位置
		print(matcher.find());
		print(matcher.group()+" - "+matcher.start());
		//第二次find匹配以及匹配的目標和匹配的起始位置
		print(matcher.find());
		print(matcher.group()+" - "+matcher.start());
 
		//第一次lookingAt匹配以及匹配的目標和匹配的起始位置
		print(matcher.lookingAt());
		print(matcher.group()+" - "+matcher.start());
 
		//第二次lookingAt匹配以及匹配的目標和匹配的起始位置
		print(matcher.lookingAt());
		print(matcher.group()+" - "+matcher.start());
	}
	public static void print(Object o){
		System.out.println(o);
	}
}
輸出結果:
false
4
true
123 - 0
true
34345 - 4
true
123 - 0
true
123 - 0

替換

查詢總是和替換結合在一起的,ctrl+f和ctrl+p就像麥當勞和肯德基吧,O(∩_∩)O哈哈~。matcher裡賣弄提供了replaceFirst、replaceAll、appendReplacement以及appendTail方法來進行替換有關的操作,下面我們我們就介紹一下這幾個方法的區別。
  • replaceFirst()只替換匹配到的第一個地方;
  • replaceAll()替換所有匹配到的地方;
  • appendReplacement()將替換位置處及之前位置處的字元複製到StringBuffer中;
  • appendTail()將替換位置之後的字元複製到StringBuffer
見下面的例子就明白了。
//: strings/TheReplacements.java
import java.util.regex.*;

public class TheReplacements {
	private static final String CONSTSTRING = "fat cat, fat cat, fat cat, I like.";
  public static void main(String[] args) throws Exception {
	  Pattern p = Pattern.compile("cat");
	  Matcher m = p.matcher(CONSTSTRING);
	  
	  //replaceFirst()只替換匹配到的第一個地方
	  System.out.println(m.replaceFirst("dog"));
	  
	  //replaceAll()替換所有匹配到的地方
	  p = Pattern.compile("cat");
	  m = p.matcher(CONSTSTRING);  
	  System.out.println(m.replaceAll("dog"));
	  
	  //appendReplacement()將替換位置處及之前位置處的字元複製到StringBuffer中;
	  //appendTail()將替換位置之後的字元複製到StringBuffer
	  p = Pattern.compile("cat");
	  m = p.matcher(CONSTSTRING);
	  StringBuffer sb = new StringBuffer();
	  while (m.find()) {
		  m.appendReplacement(sb, "dog");
		  System.out.println(sb.toString());
	  }	 
	  m.appendTail(sb);
	  System.out.println(sb.toString());
  }
}
輸出結果:
fat dog, fat cat, fat cat, I like.
fat dog, fat dog, fat dog, I like.
fat dog
fat dog, fat dog
fat dog, fat dog, fat dog
fat dog, fat dog, fat dog, I like.