1. 程式人生 > >javascript正則表達式

javascript正則表達式

標準 prototype 它的 nic 退格 作用 attr com 技術分享

RegExp 對象

RegExp 對象表示正則表達式,它是對字符串執行模式匹配的強大工具。

直接量語法

/pattern/attributes

創建 RegExp 對象的語法:

new RegExp(pattern, attributes);

參數

參數 pattern 是一個字符串,指定了正則表達式的模式或其他正則表達式。在字符串中,regexp本來就是特殊字符。我們要是想使用就必須轉義(“/”)!
 

參數 attributes 是一個可選的字符串,包含屬性 "g"、"i" 和 "m",分別用於指定全局匹配、區分大小寫的匹配和多行匹配。ECMAScript 標準化之前,不支持 m 屬性。如果 pattern

是正則表達式,而不是字符串,則必須省略該參數。

*正則表達式有兩種基本字符組成:

  1. 原義文本字符
  2. 元字符

*元字符是正則表達式中特有含義的非字母字符

這些符號有:^ $ . * + - ? = ! : | \ / ( ) [ ] { }

1.“[ ]”表示字符類: 即括號裏是個字符集,表示範圍的:如/[abc]/,表示和含有a,b,c任何一個字母的字符串都匹配,在[]組成的類內部是可以連寫的,如:[a-Za-z]。

註:特殊字符類:\s表示空格符、制表符、Unicode空白符。\S表示非Unicode空白符。(也可自定義Unicode字符類:如:

/[\u4E00-\u9FA5]/表示只匹配中文字符。)

\w 任何單字字符,相當於[a-zA-X0-9_];\W與\w相反。

\d 任何數字,相當於[0-9];\D與\w相反。

\b在字符類中使用表示退格符。[\b]則表示退格直接量。\b可以用來指定匹配位置,也可稱為錨;如:

查找一個句子裏的單詞 java , 可以使用/\bjava\b/;\B與其相反。

2.“-"表示連字符,如[a-z];

3."."表示除換行符和其他Unicode行終止符之外的任意字符。

4."^"具有兩重含義:開始標記和非,如:/^a/表示以a開始的字符,當在[]中時:/[^a]/表示非a的所有字符。

5."$"表示字符結尾。如:/^abc$/表示以c結束的字符。

6.”{}"表示重復上一項。如/\d{2,4}/表示數字出現兩次,最多出現4次。如/3{2,4}/匹配33...;333....;3333.....;不匹配3和4個3相連以上的了。它的三種格式如下{n,m}表示至少3次,最多m次;{n,}至少n次;{n}恰好n次。

7."?"表示{0,1}。

8."+"表示{1,}。

9."*"表示{0,}。

註:非貪婪的重復(如??,+?,*?,{1,5}?只匹配第一個,只要在量詞後面加上問號就可以了。)

10."|"表示分割,即或的含義。如:/ab|cd|ef/匹配含有ab或cd或ef的字符串。

11."()"包含三重用途:一是定義子表達式。二是在完整的模式中定義子模式。三是子表達式的引用。

子模式的定義可以從目標串中抽取和括號中的子模式相匹配的部分。

子模式的表達式的引用是指:可識別子模式的編號,提取它。如/(abc)\sis\s(string\w*)/;裏面含有兩個字表達式:可通過

\1指(abc);\2指(string\w*); 應用如:/['"][^'"]*['"]/不能取前後同樣的引號,可以這樣寫:/[('")[^'"]*\1]/,可起到約束作用。

註:若想()裏的不想被記憶,可采用(?:.....),將不會對其編號。

還有(?=p),(?!p)如下:

如/(javascript)?(?=\:)/ 表示匹配javascript:,但不包含:;它不匹配javascript,因為他有個條件就是後要接:;

(?!p)反前向聲明,要求接下來的字符不與模式p匹配,與(?=p)相反。

12.分組:

技術分享

反向引用:

技術分享

前瞻:

技術分享

技術分享

技術分享

正則表達式的方法:

RegExp.prototype.test()

---------------------------------------------------------------------------------------------------------------------------------

技術分享

技術分享

javascript正則表達式