1. 程式人生 > >Java 正則表示式(來自菜鳥教程)

Java 正則表示式(來自菜鳥教程)

正則表示式定義了字串的模式。

正則表示式可以用來搜尋、編輯或處理文字。

正則表示式並不僅限於某一種語言,但是在每種語言中有細微的差別。

正則表示式例項

一個字串其實就是一個簡單的正則表示式,例如 Hello World 正則表示式匹配 "Hello World" 字串。

.(點號)也是一個正則表示式,它匹配任何一個字元如:"a" 或 "1"。

下表列出了一些正則表示式的例項及描述:

正則表示式 描述

this is text

匹配字串 "this is text"

this\s+is\s+text

注意字串中的 \s+

匹配單詞 "this" 後面的 \s+ 可以匹配多個空格,之後匹配 is 字串,再之後 \s+ 匹配多個空格然後再跟上 text 字串。

可以匹配這個例項:this is text

^\d+(\.\d+)?

^ 定義了以什麼開始

\d+ 匹配一個或多個數字

? 設定括號內的選項是可選的

\. 匹配 "."

可以匹配的例項:"5", "1.5" 和 "2.21"。

Java 正則表示式和 Perl 的是最為相似的。

java.util.regex 包主要包括以下三個類:

  • Pattern 類:

    pattern 物件是一個正則表示式的編譯表示。Pattern 類沒有公共構造方法。要建立一個 Pattern 物件,你必須首先呼叫其公共靜態編譯方法,它返回一個 Pattern 物件。該方法接受一個正則表示式作為它的第一個引數。

  • Matcher 類:

    Matcher 物件是對輸入字串進行解釋和匹配操作的引擎。與Pattern 類一樣,Matcher 也沒有公共構造方法。你需要呼叫 Pattern 物件的 matcher 方法來獲得一個 Matcher 物件。

  • PatternSyntaxException:

    PatternSyntaxException 是一個非強制異常類,它表示一個正則表示式模式中的語法錯誤。

以下例項中使用了正則表示式 .*runoob.* 用於查詢字串中是否包了 runoob 子串:

例項

importjava.util.regex.*;classRegexExample1{publicstaticvoidmain(Stringargs[]){Stringcontent ="I am noob" +"from runoob.com.";Stringpattern =".*runoob.*";booleanisMatch =Pattern.matches(pattern,content);System.out.println("字串中是否包含了 'runoob' 子字串? " +isMatch);}}

例項輸出結果為:

字串中是否包含了 'runoob' 子字串? true

捕獲組

捕獲組是把多個字元當一個單獨單元進行處理的方法,它通過對括號內的字元分組來建立。

例如,正則表示式 (dog) 建立了單一分組,組裡包含"d","o",和"g"。

捕獲組是通過從左至右計算其開括號來編號。例如,在表示式((A)(B(C))),有四個這樣的組:

  • ((A)(B(C)))
  • (A)
  • (B(C))
  • (C)

可以通過呼叫 matcher 物件的 groupCount 方法來查看錶達式有多少個分組。groupCount 方法返回一個 int 值,表示matcher物件當前有多個捕獲組。

還有一個特殊的組(group(0)),它總是代表整個表示式。該組不包括在 groupCount 的返回值中。

例項

下面的例子說明如何從一個給定的字串中找到數字串:

RegexMatches.java 檔案程式碼:

importjava.util.regex.Matcher;importjava.util.regex.Pattern;publicclassRegexMatches{publicstaticvoidmain(Stringargs[]){// 按指定模式在字串查詢Stringline ="This order was placed for QT3000! OK?";Stringpattern ="(\\D*)(\\d+)(.*)";// 建立 Pattern 物件Patternr =Pattern.compile(pattern);// 現在建立 matcher 物件Matcherm =r.matcher(line);if(m.find()){System.out.println("Found value: " +m.group(0));System.out.println("Found value: " +m.group(1));System.out.println("Found value: " +m.group(2));System.out.println("Found value: " +m.group(3));}else{System.out.println("NO MATCH");}}}

以上例項編譯執行結果如下:

Found value:This order was placed for QT3000! OK?Found value:This order was placed for QT
Found value:3000Found value:! OK?

正則表示式語法

在其他語言中,\\ 表示:我想要在正則表示式中插入一個普通的(字面上的)反斜槓,請不要給它任何特殊的意義。

在 Java 中,\\ 表示:我要插入一個正則表示式的反斜線,所以其後的字元具有特殊的意義。

所以,在其他的語言中,一個反斜槓\就足以具有轉義的作用,而在正則表示式中則需要有兩個反斜槓才能被解析為其他語言中的轉義作用。也可以簡單的理解在正則表示式中,兩個 \ 代表其他語言中的一個 \,這也就是為什麼表示一位數字的正則表示式是 \\d,而表示一個普通的反斜槓是 \\\\

字元

說明

\

將下一字元標記為特殊字元、文字、反向引用或八進位制轉義符。例如,"n"匹配字元"n"。"\n"匹配換行符。序列"\\\\"匹配"\\","\\("匹配"("。

^

匹配輸入字串開始的位置。如果設定了 RegExp 物件的 Multiline 屬性,^ 還會與"\n"或"\r"之後的位置匹配。

$

匹配輸入字串結尾的位置。如果設定了 RegExp 物件的 Multiline 屬性,$ 還會與"\n"或"\r"之前的位置匹配。

*

零次或多次匹配前面的字元或子表示式。例如,zo* 匹配"z"和"zoo"。* 等效於 {0,}。

+

一次或多次匹配前面的字元或子表示式。例如,"zo+"與"zo"和"zoo"匹配,但與"z"不匹配。+ 等效於 {1,}。

?

零次或一次匹配前面的字元或子表示式。例如,"do(es)?"匹配"do"或"does"中的"do"。? 等效於 {0,1}。

{n}

是非負整數。正好匹配 n 次。例如,"o{2}"與"Bob"中的"o"不匹配,但與"food"中的兩個"o"匹配。

{n,}

是非負整數。至少匹配 次。例如,"o{2,}"不匹配"Bob"中的"o",而匹配"foooood"中的所有 o。"o{1,}"等效於"o+"。"o{0,}"等效於"o*"。

{n,m}

M 和 n 是非負整數,其中 n <= m。匹配至少 n 次,至多 m 次。例如,"o{1,3}"匹配"fooooood"中的頭三個 o。'o{0,1}' 等效於 'o?'。注意:您不能將空格插入逗號和數字之間。

?

當此字元緊隨任何其他限定符(*、+、?、{n}、{n,}、{n,m})之後時,匹配模式是"非貪心的"。"非貪心的"模式匹配搜尋到的、儘可能短的字串,而預設的"貪心的"模式匹配搜尋到的、儘可能長的字串。例如,在字串"oooo"中,"o+?"只匹配單個"o",而"o+"匹配所有"o"。

.

匹配除"\r\n"之外的任何單個字元。若要匹配包括"\r\n"在內的任意字元,請使用諸如"[\s\S]"之類的模式。

(pattern)

匹配 pattern 並捕獲該匹配的子表示式。可以使用 $0…$9 屬性從結果"匹配"集合中檢索捕獲的匹配。若要匹配括號字元 ( ),請使用"\("或者"\)"。

(?:pattern)

匹配 pattern 但不捕獲該匹配的子表示式,即它是一個非捕獲匹配,不儲存供以後使用的匹配。這對於用"or"字元 (|) 組合模式部件的情況很有用。例如,'industr(?:y|ies) 是比 'industry|industries' 更經濟的表示式。

(?=pattern)

執行正向預測先行搜尋的子表示式,該表示式匹配處於匹配 pattern 的字串的起始點的字串。它是一個非捕獲匹配,即不能捕獲供以後使用的匹配。例如,'Windows (?=95|98|NT|2000)' 匹配"Windows 2000"中的"Windows",但不匹配"Windows 3.1"中的"Windows"。預測先行不佔用字元,即發生匹配後,下一匹配的搜尋緊隨上一匹配之後,而不是在組成預測先行的字元後。

(?!pattern)

執行反向預測先行搜尋的子表示式,該表示式匹配不處於匹配 pattern 的字串的起始點的搜尋字串。它是一個非捕獲匹配,即不能捕獲供以後使用的匹配。例如,'Windows (?!95|98|NT|2000)' 匹配"Windows 3.1"中的 "Windows",但不匹配"Windows 2000"中的"Windows"。預測先行不佔用字元,即發生匹配後,下一匹配的搜尋緊隨上一匹配之後,而不是在組成預測先行的字元後。

x|y

匹配 x 或 y。例如,'z|food' 匹配"z"或"food"。'(z|f)ood' 匹配"zood"或"food"。

[xyz]

字符集。匹配包含的任一字元。例如,"[abc]"匹配"plain"中的"a"。

[^xyz]

反向字符集。匹配未包含的任何字元。例如,"[^abc]"匹配"plain"中"p","l","i","n"。

[a-z]

字元範圍。匹配指定範圍內的任何字元。例如,"[a-z]"匹配"a"到"z"範圍內的任何小寫字母。

[^a-z]

相關推薦

Java 表示式來自教程

正則表示式定義了字串的模式。 正則表示式可以用來搜尋、編輯或處理文字。 正則表示式並不僅限於某一種語言,但是在每種語言中有細微的差別。 正則表示式例項 一個字串其實就是一個簡單的正則表示式,例如 Hello World 正則表示式匹配 "Hello World" 字串。 .(

java表示式不定期更新

自己編寫使用過的以及網路蒐集整理的正則表示式備份,只在java中測試過,其餘可參考,歡迎討論、指正。 匹配數字(包含負數、小數): ^[-\\+]?[0-9]+[.]?[0-9]+$   匹配網頁中圖片連結(圖片格式可修改、新增): (?<=<img

Java表示式筆記歸納

public class Regex { //1、正則表示式:是有規則的一種表示式 // 我們常用regex來表示正則表示式 // 主要作用: // 通過一種有規則的字元模式,對 目標字串進行查詢、提取、替換、分割的作用 // 典型的應用場景:校驗相關字元是否匹配規則:使用者名稱

JAVA 表示式 超詳細

在Sun的Java JDK 1.40版本中,Java自帶了支援正則表示式的包,本文就拋磚引玉地介紹瞭如何使用java.util.regex包。   可粗略估計一下,除了偶爾用Linux的外,其他Linu x使用者都會遇到正則表示式。正則表示式是個極端強大工具,而且在字串模式-匹配和字串模式-替換方面富有

表示式input輸入校驗

大於0的正整數(不包括0) var reg = /^\+?[1-9]\d*$/;     正整數和0(包括0) var reg = /^[1-9]\d*|0$/; 最多2位小數(非負) var reg = /\d+(\.\d{0,2})?/ input輸入框

表示式Pattern和Matcher類

正則表示式: 概念:正確規則的表示式 規則java給我們定的,是指一個用來描述或者匹配一系列符合某個句法規則的字串的單個字串。其實就是一種規則。有自己特殊的應用。 正則表示式的組成規則 規則字元在java.util.regex Pattern類中 A:字元 x 字元 x。舉例:‘

常用表示式高亮,markdown

校驗數字的表示式 1 數字:^[0-9]*$ 2 n位的數字:^\d{n}$ 3 至少n位的數字:^\d{n,}$ 4 m-n位的數字:^\d{m,n}$ 5 零和非零開頭的數字:^(0|[1-9][0-9]*)$ 6 非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(

表示式手機號 身份證號

                一、手機號:/^1[34578]\d{9}$/ 二、身份證號:/^(^[1-9]\d{7}((0\d

表示式JS表格簡要總結

1. JS中正則表示式定義 JavaScript 中的正則表示式用 RegExp 物件表示。 JS中定義正則表示式的兩種方法: 方法 示例 RegExp 物件 var pattern = new RegExp("s"); 直接量 var pattern = /s/;

學習AngularJS摘抄的筆記,方便以後檢視摘自教程

AngularJS 參考手冊 AngularJS 指令 指令 描述 定義應用程式的根元素。 繫結 HTML 元素到應用程式資料 繫結 HTML 元素的 innerHTML 到應用程式資料,並移除 HTML 字串中危險字元 規定 blur 事件的行為

表示式模式器,匹配器java中的日期表示

正則表示式 正則表示式:用於匹配某些特定字串的一個規則。 沒有學會使用正則表示式的時候,我們遇到過這麼一個需求-----校驗使用者名稱是否合法? 具體要求如下: 1)使用者名稱長度必須在6到15之間 2)必須是字母數字組合 非正則具體實現如下 public clas

java-Script-----表示式15

收集整理了15個常用的javaScript正則表示式,其中包括使用者名稱、密碼強度、整數、數字、電子郵件地址(Email)、手機號碼、身份證號、URL地址、 IPv4地址、 十六進位制顏色、 日期、 QQ號碼、 微訊號、車牌號、中文正則。表單驗證處理必備。 1 使用者名稱正

java表示式大全常用

一、校驗數字的表示式 1 數字:^[0-9]*$ 2 n位的數字:^\d{n}$ 3 至少n位的數字:^\d{n,}$ 4 m-n位的數字:^\d{m,n}$ 5 零和非零開頭的數字:^(0|[1-9][0-9]*)$ 6 非零開頭的最多帶兩位小數的數字

表示式Regular Expression高階使用文字編輯器,資料庫,Java

一、開發環境和文字編輯器中使用正則表示式 eclipse Notepad++ EditPlus UltraEdit 二、資料庫中也可以使用正則表示式 Mysq15.5以上 Oracle10g以上 例如: SELECT prod_name

深入入門表示式java

很多正則引擎都支援命名分組,java是在java7中才引入這個特性,語法與.Net類似(.Net允許同一表示式出現名字相同的分組,java不允許)。命名分組很好理解,就是給分組進行命名。下面簡單演示一下java中如何使用以及注意事項。1.正則中定義名為NAME的分組(?<

java表示式詳解匹配、切割和替換

正則表示式:符合一定規則的表示式。作用:用於專門操作字串。特點:用於一些特定的符號來表示一些程式碼操作,這樣就簡化書寫。所以學習正則表示式,就是在學習一些特殊符號的使用。好處:可以簡化對字串的複雜操作。弊端:符號定義越多,正則越長,閱讀性越差。 具體操作功能: 1,匹配:

表示式Java語言為例

正則表示式的概念: 用來匹配和處理文字的字串。人們常用模式(pattern)來表示實際的正則表示式。正則表示式是由正則表示式語言建立的。正則表示式語言是內置於其他語言或軟體產品裡的”迷你“語言,但它並不是一種完備的程式設計語言。不同的程式語言或應用程式裡,正則

JAVA中的表示式pattern/match

正則表示式概念 所謂正則表示式就是處理字串的特殊字串 用途 字串匹配(字元匹配) 字串查詢(是建立在匹配之上的查詢) 字串替換(是建立在查詢的結果之後的替換) 例如 IP地址是否正確 從網頁中揪出Email地址 從網頁揪出連結 類 java.lang.Stri

表示式程式碼java

[toc] >重新發佈於2020年09月27日,寫於2016年 看了好些天的正則表示式,終於有時間來寫一篇關於它的部落格了。也是因為前段時間做標籤處理的工作用到,用正則匹配標籤規則,少寫了不少程式碼。在有的地方使用正則表示式確實特別棒。參考[博文http://blog.csdn.net/yaerfeng/a

表達式--anton筆記

-type git document cos nan 訪問 編輯 重寫 信用卡 正則表達式 正則表達式(Regular Expression)是一種文本模式,包括普通字符(例如,a 到 z 之間的字母)和特殊字符(稱為"元字符")。 正則表達式使用單個字符串來描述、匹配