1. 程式人生 > >正則表達式的四大操作(匹配,切割,替換,獲取)

正則表達式的四大操作(匹配,切割,替換,獲取)

都沒有 第一次 擴展 判斷 區分 擴展表達式 string 個數 asc

這裏只介紹js中對正則表達式的相關操作,關於正則表達式的詳細介紹,請參考
http://manual.phpv.net/regular_expression.html 一、js中正則表達式操作 1、定義正則表達式 1)定義正則表達式有兩種形式,一種是普通方式,一種是構造函數方式。
2)普通方式:var reg=/表達式/附加參數 附加參數:用來擴展表達式的含義,目前主要有三個參數:
g:代表可以進行全局匹配。
i:代表不區分大小寫匹配。
m:代表可以進行多行匹配。 例子:
var reg=/a*b/;
var reg=/abc+f/g;
3)構造函數方式:var reg=new RegExp(“表達式”,”附加參數”);

例子:
var reg=new RegExp(“a*b”);
var reg=new RegExp(“abc+f”,”g”);
4)普通方式與構造函數方式的區別
普通方式中的表達式必須是一個常量字符串,而構造函數中的表達式可以是常量字符串,也可以是一個js變量,例如根據用戶的輸入來作為表達式參數等等:
var reg=new RegExp(document.forms[0].exprfiled.value,”g”);2、表達式操作,在這裏是指和表達式相關的方法,我們將介紹六個方法。 1)表達式對象(RegExp)方法: 1>exec
(str),返回str中與表達式相匹配的第一個字符串,而且以數組的形式表現,當然如果表達式中含有捕捉用的小括號,則返回的數組中也可能含有()中的匹配字符串,例如:
var regx=/\d+/;
var rs=regx.exec(“3432ddf53”);
返回的rs值為:{3432}
var regx2=new RegExp(“ab(\d+)c”);
var rs2=regx2.exec(“ab234c44”);
返回的rs值為:{ab234c,234}
另外,如果有多個合適的匹配,則第一次執行exec返回一個第一個匹配,此時繼續執行exec,則依次返回第二個第三個匹配。例如:
var regx=/user\d/g;
var rs=regx.exec(“ddduser1dsfuser2dd”);
var rs1=regx.exec(“ddduser1dsfuser2dd”);
則rs的值為{user1},rs的值為{rs2},當然註意regx中的g參數是必須的,否則無論exec執行多少次,都返回第一個匹配。後面還有相關內容涉及到對此想象的解釋。 2>test(str),判斷字符串str是否匹配表達式,返回一個布爾值。例如:
var regx=/user\d+/g;
var flag=regx.test(“user12dd”);
flag的值為true。 2)String對象方法 1>match(expr),返回與expr相匹配的一個字符串數組,如果沒有加參數g,則返回第一個匹配,加入參數g則返回所有的匹配
例子:
var regx=/user\d/g;
var str=“user13userddduser345”;
var rs=str.match(regx);
rs的值為:{user1,user3} 2>search(expr),返回字符串中與expr相匹配的第一個匹配的index值。
例子:
var regx=/user\d/g;
var str=“user13userddduser345”;
var rs=str.search(regx);
rs的值為:0 3>replace(expr,str),將字符串中匹配expr的部分替換為str。另外在replace方法中,str中可以含有一種變量符號$,格式為$n,代表匹配中被記住的第n的匹配字符串(註意小括號可以記憶匹配)。
例子:
var regx=/user\d/g;
var str=“user13userddduser345”;
var rs=str.replace(regx,”00”);
rs的值為:003userddd0045
例子2:
var regx=/u(se)r\d/g;
var str=“user13userddduser345”;
var rs=str.replace(regx,”$1”);
rs的值為:se3userdddse45
對於replace(expr,str)方法還要特別註意一點,如果expr是一個表達式對象則會進行全局替換(此時表達式必須附加參數g,否則也只是替換第一個匹配),如果expr是一個字符串對象,則只會替換第一個匹配的部分,例如:
var regx=“user”
var str=“user13userddduser345”;
var rs=str.replace(regx,”00”);
rs的值為: 0013userddduser345 4>split(expr),將字符串以匹配expr的部分做分割,返回一個數組,而且表達式是否附加參數g都沒有關系,結果是一樣的。
例子:
var regx=/user\d/g;
var str=“user13userddduser345”;
var rs=str.split(regx);
rs的值為:{3userddd,45} 2、表達式相關屬性 1)表達式相關屬性,是指和表達式相關的屬性,如下面的形式:
var regx=/myexpr/;
var rs=regx.exec(str);
其中,和表達式自身regx相關的屬性有兩個,和表達式匹配結果rs相關的屬性有三個,下面將逐一介紹。
2)和表達式自身相關的兩個屬性: 1>lastIndex,返回開始下一個匹配的位置,註意必須是全局匹配(表達式中帶有g參數)時,lastIndex才會有不斷返回下一個匹配值,否則該值為總是返回第一個下一個匹配位置,例如:
var regx=/user\d/;
var rs=regx.exec(“sdsfuser1dfsfuser2”);
var lastIndex1=regx.lastIndex;
rs=regx.exec(“sdsfuser1dfsfuser2”);
var lastIndex2=regx.lastIndex;
rs=regx.exec(“sdsfuser1dfsfuser2”);
var lastIndex3=regx.lastIndex;
上面lastIndex1為9,第二個lastIndex2也為9,第三個也是9;如果regx=/user\d/g,則第一個為9,第二個為18,第三個為0。 2>source,返回表達式字符串自身。例如:
var regx=/user\d/;
var rs=regx.exec(“sdsfuser1dfsfuser2”);
var source=regx.source;
source的值為user\d
3)和匹配結果相關的三個屬性: 1>index,返回當前匹配的位置。例如:
var regx=/user\d/;
var rs=regx.exec(“sdsfuser1dfsfuser2”);
var index1=rs.index;
rs=regx.exec(“sdsfuser1dfsfuser2”);
var index2=rs.index;
rs=regx.exec(“sdsfuser1dfsfuser2”);
var index3=rs.index;
index1為4,index2為4,index3為4,如果表達式加入參數g,則index1為4,index2為13,index3會報錯(index為空或不是對象)。 2>input,用於匹配的字符串。例如:
var regx=/user\d/;
var rs=regx.exec(“sdsfuser1dfsfuser2”);
var input=rs.input;
input的值為sdsfuser1dfsfuser2。 3>[0],返回匹配結果中的第一個匹配值,對於match而言可能返回一個多值的數字,則除了[0]外,還可以取[1]、[2]等等。例如:
var regx=/user\d/;
var rs=regx.exec(“sdsfuser1dfsfuser2”);
var value1=rs[0];
rs=regx.exec(“sdsfuser1dfsfuser2”);
var value2=rs[0];
value1的值為user1,value2的值為user2 3、實際應用 1)實際應用一
描述:有一表單,其中有一個“用戶名”input域
要求:漢字,而且不能少於2個漢字,不能多於4個漢字。 <script>
function checkForm(obj){
var username=obj.username.value;
var regx=/^[\u4e00-\u9fa5]{2,4}$/g
if(!regx.test(username)){
alert(“Invalid username!”);
return false;
}
return true; </script>
<form name=“myForm”onSubmit=“return checkForm(this)”>
<input type=“text” name=“username”/>
<input type=“submit” vlaue=“submit”/>
</form>
2)實際應用二
描述:給定一個含有html標記的字符串,要求將其中的html標記去掉。 <script>
function toPlainText(htmlStr){
var regx=/<[^>]*>|<\/[^>]*>/gm;
var str=htmlStr.replace(regx,"");
return str; </script>
<form name=“myForm”>
<textarea id=“htmlInput”></textarea>
<input type=“button” value=“submit” onclick=“toPlainText(document.getElementByIdx_x(‘htmlInput’).value”/>
</form> 二、小結 1,Javascript 正則表達式,我想在一般的程序員之中,使用者應該不是很多,因為我們處理的頁面一般都不是很復雜,而復雜的邏輯一般我們都在後臺處理完成了。但是目前趨勢 已經出現了扭轉,富客戶端已經被越來越多的人接受,而Javascript就是其中的關鍵技術,對於復雜的客戶端邏輯而言,正則表達式的作用也是很關鍵 的,同時它也是Javascript高手必須要掌握的重要技術之一。 2,為了能夠便於大家對前面講述的內容有一個更為綜合和深刻的認識,我將前面的一些關鍵點和容易犯糊塗的地方再系統總結一下,這部分很關鍵!
總結1:附件參數g的用法
表達式加上參數g之後,表明可以進行全局匹配,註意這裏“可以”的含義。我們詳細敘述:
1)對於表達式對象的exec方法,不加入g,則只返回第一個匹配,無論執行多少次均是如此,如果加入g,則第一次執行也返回第一個匹配,再執行返回第二個匹配,依次類推。例如
var regx=/user\d/;
var str=“user18dsdfuser2dsfsd”;
var rs=regx.exec(str);//此時rs的值為{user1}
var rs2=regx.exec(str);//此時rs的值依然為{user1}
如果regx=/user\d/g;則rs的值為{user1},rs2的值為{user2}
通過這個例子說明:對於exec方法,表達式加入了g,並不是說執行exec方法就可以返回所有的匹配,而是說加入了g之後,我可以通過某種方式得到所有的匹配,這裏的“方式”對於exec而言,就是依次執行這個方法即可。
2)對於表達式對象的test方法,加入g於不加上g沒有什麽區別。
3) 對於String對象的match方法,不加入g,也只是返回第一個匹配,一直執行match方法也總是返回第一個匹配,加入g,則一次返回所有的匹配 (註意這與表達式對象的exec方法不同,對於exec而言,表達式即使加上了g,也不會一次返回所有的匹配)。例如:
var regx=/user\d/;
var str=“user1sdfsffuser2dfsdf”;
var rs=str.match(regx);//此時rs的值為{user1}
var rs2=str.match(regx);//此時rs的值依然為{user1}
如果regx=/user\d/g,則rs的值為{user1,user2},rs2的值也為{user1,user2}
4)對於String對象的replace方法,表達式不加入g,則只替換第一個匹配,如果加入g,則替換所有匹配。(開頭的三道測試題能很好的說明這一點)
5)對於String對象的split方法,加上g與不加g是一樣的,即:
var sep=/user\d/;
var array=“user1dfsfuser2dfsf”.split(sep);
則array的值為{dfsf, dfsf}
此時sep=/user\d/g,返回值是一樣的。
6)對於String對象的search方法,加不加g也是一樣的。
總結2:附加參數m的用法
附加參數m,表明可以進行多行匹配,但是這個只有當使用^和$模式時才會起作用,在其他的模式中,加不加入m都可以進行多行匹配(其實說多行的字符串也是一個普通字符串),我們舉例說明這一點
1)使用^的例子
var regx=/^b./g;
var str=“bd76 dfsdf
sdfsdfs dffs
b76dsf sdfsdf”;
var rs=str.match(regx);
此 時加入g和不加入g,都只返回第一個匹配{bd},如果regx=/^b./gm,則返回所有的匹配{bd,b7},註意如果regx=/^b./m,則 也只返回第一個匹配。所以,加入m表明可以進行多行匹配,加入g表明可以進行全局匹配,綜合到一起就是可以進行多行全局匹配
2)使用其他模式的例子,例如
var regx=/user\d/;
var str=“sdfsfsdfsdf
sdfsuser3 dffs
b76dsf user6”;
var rs=str.match(regx);
此時不加參數g,則返回{user3},加入參數g返回{user3,user6},加不加入m對此沒有影響。
3)因此對於m我們要清楚它的使用,記住它只對^和$模式起作用,在這兩種模式中,m的作用為:如果不加入m,則只能在第一行進行匹配,如果加入m則可以在所有的行進行匹配。我們再看一個^的例子
var regx=/^b./;
var str=“ret76 dfsdf
bjfsdfs dffs
b76dsf sdfsdf”;
var rs=str.match(regx);
此 時rs的值為null,如果加入g,rs的值仍然為null,如果加入m,則rs的值為{bj}(也就是說,在第一行沒有找到匹配,因為有參數m,所以可 以繼續去下面的行去找是否有匹配),如果m和g都加上,則返回{bj,b7}(只加m不加g說明,可以去多行進行匹配,但是找到一個匹配後就返回,加 入 g表明將多行中所有的匹配返回,當然對於match方法是如此,對於exec呢,則需要執行多次才能依次返回)
總結3:在HTML的textarea輸入域中,按一個Enter鍵,對應的控制字符為“\r\n”,即“回車換行”,而不是“\n\r”,即“換行回車”,我們看一個前面我們舉過的例子:
var regx=/a\r\nbc/;
var str=“a
bc”;
var rs=regx.exec(str);
結果:匹配成功,rs的值為:{

},如果表達式為/a\n\rbc/,則不會被匹配,因此在一般的編輯器中一個”Enter”鍵代表著“回車換行”,而非“換行回車”,至少在

正則表達式的四大操作(匹配,切割,替換,獲取)