1. 程式人生 > >正則表示式的例子

正則表示式的例子

正則表示式用於字串處理,表單驗證等場合,實用高效,但用到時總是不太把握,以致往往要上網查一番。我將一些常用的表示式收藏在這裡,作備忘之用。本貼隨時會更新。

匹配中文字元的正則表示式: [/u4e00-/u9fa5]

匹配雙位元組字元(包括漢字在內):[^/x00-/xff]

應用:計算字串的長度(一個雙位元組字元長度計2,ASCII字元計1)

String.prototype.len=function(){return this.replace([^/x00-/xff]/g,"aa").length;}

匹配空行的正則表示式:/n[/s| ]*/r

匹配HTML標記的正則表示式:/<(.*)>.*<///1>|<(.*) //>/

匹配首尾空格的正則表示式:(^/s*)|(/s*$)

應用:javascript中沒有像vbscript那樣的trim函式,我們就可以利用這個表示式來實現,如下:

String.prototype.trim = function()
{
    return this.replace(/(^/s*)|(/s*$)/g, "");
}

利用正則表示式分解和轉換IP地址:

下面是利用正則表示式匹配IP地址,並將IP地址轉換成對應數值的Javascript程式:

function IP2V(ip)
{
 re=/(/d+)/.(/d+)/.(/d+)/.(/d+)/g  //匹配IP地址的正則表示式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
 throw new Error("Not a valid IP address!")
}
}

不過上面的程式如果不用正則表示式,而直接用split函式來分解可能更簡單,程式如下:

var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

匹配Email地址的正則表示式:/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*

匹配網址URL的正則表示式:http://([/w-]+/.)+[/w-]+(/[/w- ./?%&=]*)?

利用正則表示式去除字串中重複的字元的演算法程式

:[注:此程式不正確,原因見本貼回覆]

var s="abacabefgeeii"
var s1=s.replace(/(.).*/1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2)  //結果為:abcefgi

我原來在CSDN上發貼尋求一個表示式來實現去除重複字元的方法,最終沒有找到,這是我能想到的最簡單的實現方法。思路是使用後向引用取出包括重複的字元,再以重複的字元建立第二個表示式,取到不重複的字元,兩者串連。這個方法對於字元順序有要求的字串可能不適用。

得用正則表示式從URL地址中提取檔名的javascript程式,如下結果為page1

s="http://www.9499.net/page1.htm"
s=s.replace(/(.*//){0,}([^/.]+).*/ig,"$2")
alert(s)

利用正則表示式限制網頁表單裡的文字框輸入內容:

用正則表示式限制只能輸入中文:onkeyup="value=value.replace(/[^/u4E00-/u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/u4E00-/u9FA5]/g,''))"

用正則表示式限制只能輸入全形字元: onkeyup="value=value.replace(/[^/uFF00-/uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/uFF00-/uFFFF]/g,''))"

用正則表示式限制只能輸入數字:onkeyup="value=value.replace(/[^/d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/d]/g,''))"

用正則表示式限制只能輸入數字和英文:onkeyup="value=value.replace(/[/W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/d]/g,''))"

正則表示式,相關連結
http://blog.csdn.net/laily/category/19548.aspx
http://blog.csdn.net/laily/archive/2004/06/30/30525.aspx 微軟的正則表示式教程(五):選擇/編組和後向引用

http://blog.csdn.net/laily/archive/2004/06/30/30522.aspx 微軟的正則表示式教程(四):限定符和定位符

http://blog.csdn.net/laily/archive/2004/06/30/30517.aspx 微軟的正則表示式教程(三):字元匹配

http://blog.csdn.net/laily/archive/2004/06/30/30514.aspx 微軟的正則表示式教程(二):正則表示式語法和優先權順序

http://blog.csdn.net/laily/archive/2004/06/30/30511.aspx 微軟的正則表示式教程(一):正則表示式簡介

http://blog.csdn.net/laily/archive/2004/06/30/30360.aspx 小程式大作為:高階查詢/替換、正則表示式練習器、Javascript指令碼程式偵錯程式

http://blog.csdn.net/laily/archive/2004/06/24/25872.aspx 經典正則表示式

正則表示式,正規表示式,正則表示式匹配,正則表示式語法,模式匹配,正規表示式匹配 javascript正則表示式 ASP正則表示式 ASP.NET正則表示式 C#正則表示式 JSP正則表示式 PHP正則表示式 VB.NET正則表示式 VBSCript正則表示式程式設計 delphi正則表示式 jscript

補充:
^/d+$  //匹配非負整數(正整數 + 0)
^[0-9]*[1-9][0-9]*$  //匹配正整數
^((-/d+)|(0+))$  //匹配非正整數(負整數 + 0)
^-[0-9]*[1-9][0-9]*$  //匹配負整數
^-?/d+$    //匹配整數
^/d+(/./d+)?$  //匹配非負浮點數(正浮點數 + 0)
^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$  //匹配正浮點數
^((-/d+(/./d+)?)|(0+(/.0+)?))$  //匹配非正浮點數(負浮點數 + 0)
^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$  //匹配負浮點數
^(-?/d+)(/./d+)?$  //匹配浮點數
^[A-Za-z]+$  //匹配由26個英文字母組成的字串
^[A-Z]+$  //匹配由26個英文字母的大寫組成的字串
^[a-z]+$  //匹配由26個英文字母的小寫組成的字串
^[A-Za-z0-9]+$  //匹配由數字和26個英文字母組成的字串
^/w+$  //匹配由數字、26個英文字母或者下劃線組成的字串
^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$    //匹配email地址
^[a-zA-z]+://匹配(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$  //匹配url

利用正則表示式去除字串中重複的字元的演算法程式:

var s="abacabefgeeii"
var s1=s.replace(/(.).*/1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為:abcefgi
===============================
如果var s = "abacabefggeeii"
結果就不對了,結果為:abeicfgg
正則表示式的能力有限

1.確認有效電子郵件格式
下面的程式碼示例使用靜態 Regex.IsMatch 方法驗證一個字串是否為有效電子郵件格式。如果字串包含一個有效的電子郵件地址,則 IsValidEmail 方法返回 true,否則返回 false,但不採取其他任何操作。您可以使用 IsValidEmail,在應用程式將地址儲存在資料庫中或顯示在 ASP.NET 頁中之前,篩選出包含無效字元的電子郵件地址。

[Visual Basic]
Function IsValidEmail(strIn As String) As Boolean
' Return true if strIn is in valid e-mail format.
Return Regex.IsMatch(strIn, ("^([/w-/.]+)@((/[[0-9]{1,3}/.[0-9]{1,3}/.[0-9]{1,3}/.)|(([/w-]+/.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(/]?)$")
End Function
[C#]
bool IsValidEmail(string strIn)
{
// Return true if strIn is in valid e-mail format.
return Regex.IsMatch(strIn, @"^([/w-/.]+)@((/[[0-9]{1,3}/.[0-9]{1,3}/.[0-9]{1,3}/.)|(([/w-]+/.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(/]?)$");
}


2.清理輸入字串
下面的程式碼示例使用靜態 Regex.Replace 方法從字串中抽出無效字元。您可以使用這裡定義的 CleanInput 方法,清除掉在接受使用者輸入的窗體的文字欄位中輸入的可能有害的字元。CleanInput 在清除掉除 @、-(連字元)和 .(句點)以外的所有非字母數字字元後返回一個字串。

[Visual Basic]
Function CleanInput(strIn As String) As String
' Replace invalid characters with empty strings.
Return Regex.Replace(strIn, "[^/w/[email protected]]", "")
End Function
[C#]
String CleanInput(string strIn)
{
// Replace invalid characters with empty strings.
return Regex.Replace(strIn, @"[^/w/[email protected]]", "");
}


3.更改日期格式
以下程式碼示例使用 Regex.Replace 方法來用 dd-mm-yy 的日期形式代替 mm/dd/yy 的日期形式。

[Visual Basic]
Function MDYToDMY(input As String) As String
Return Regex.Replace(input, _
"/b(?<month>/d{1,2})/(?<day>/d{1,2})/(?<year>/d{2,4})/b", _
"${day}-${month}-${year}")
End Function
[C#]
String MDYToDMY(String input)
{
return Regex.Replace(input,
"//b(?<month>//d{1,2})/(?<day>//d{1,2})/(?<year>//d{2,4})//b",
"${day}-${month}-${year}");
}
Regex 替換模式
本示例說明如何在 Regex.Replace 的替換模式中使用命名的反向引用。其中,替換表示式 ${day} 插入由 (?<day>...) 組捕獲的子字串。

有幾種靜態函式使您可以在使用正則表示式操作時無需建立顯式正則表示式物件,而 Regex.Replace 函式正是其中之一。如果您不想保留編譯的正則表示式,這將給您帶來方便


4.提取 URL 資訊
以下程式碼示例使用 Match.Result 來從 URL 提取協議和埠號。例如,“http://www.contoso.com:8080/letters/readme.html”將返回“http:8080”。

[Visual Basic]
Function Extension(url As String) As String
Dim r As New Regex("^(?<proto>/w+)://[^/]+?(?<port>:/d+)?/", _
RegexOptions.Compiled)
Return r.Match(url).Result("${proto}${port}")
End Function
[C#]
String Extension(String url)
{
Regex r = new Regex(@"^(?<proto>/w+)://[^/]+?(?<port>:/d+)?/",
RegexOptions.Compiled);
return r.Match(url).Result("${proto}${port}");