java_正則簡單介紹,正則匹配頁面時經常會遇見各種不匹配,下面是我copy過來的一些正則語法嘗試和一些常用正則表示式
正則表示式語法
一個正則表示式就是由普通字元(例如字元 a 到 z)以及特殊字元(稱為元字元)組成的文字模式。該模式描述在查詢文字主體時待匹配的一個或多個字串。正則表示式作為一個模板,將某個字元模式與所搜尋的字串進行匹配。
這裡有一些可能會遇到的正則表示式示例:
Visual Basic Scripting Edition VBScript 匹配
/^\[ \t]*$/ "^\[ \t]*$" 匹配一個空白行。
/\d{2}-\d{5}/ "\d{2}-\d{5}" 驗證一個ID 號碼是否由一個2位數字,一個連字元以及一個5位數字組成。
/<(.*)>.*<\/\1>/ "<(.*)>.*<\/\1>" 匹配一個 HTML 標記。
下表是元字元及其在正則表示式上下文中的行為的一個完整列表:
字元 描述
\ 將下一個字元標記為一個
-----
去掉轉義字元為^/.*\.do$ 和 ^/.*\.[-\w]+$ 第一個的意思是一行以 ".do"結尾的字串。 第二個的意思是一行以點"." 後面結以減號"-"或字母、數字、下劃線"\w"結束的字串。
1.<img\s+alt=('([^']*)'|\"([^\"])*\")\s+src=('([/,\w,\d,\.]*)'|\"([/,\w,\d,\.]*)\") 這是 匹配img 元素 alt 的值和 src的值
2.String regx = "<img\\s+alt=('([^']*)'|\"([^\"])*\")\\s+src=('([/,\\w,\\d,\\.]*)'|\"([/,\\w,\\d,\\.]*)\")"; 同上
3 String regex = "(?i)(\\<img)([^\\>]+\\>)"; String input = "<img src=\"\" alt=\"\" >"; input = input.replaceAll (regex, "$1 style=\"width:500px;height:400px;\"$2"); System.out.println (input);
結果為<img style="width:500px;height:400px;" src="" alt="" >