1. 程式人生 > >[LeetCode] Valid Phone Numbers 驗證電話號碼

[LeetCode] Valid Phone Numbers 驗證電話號碼

Given a text file file.txt that contains list of phone numbers (one per line), write a one liner bash script to print all valid phone numbers.

You may assume that a valid phone number must appear in one of the following two formats: (xxx) xxx-xxxx or xxx-xxx-xxxx. (x means a digit)

You may also assume each line in the text file must not contain leading or trailing white spaces.

For example, assume that file.txt has the following content:

987-123-4567
123 456 7890
(123) 456-7890

Your script should output the following valid phone numbers:

987-123-4567
(123) 456-7890

這道題讓我們驗證數字串是否為正確的電話號碼的格式,而且規定了正確的格式只有兩種(xxx) xxx-xxxx or xxx-xxx-xxxx,那麼我們可以看出來區別就是在前幾個字元,而後八個字元都相同。這題有多種解法,我們首先來看使用awk命令的解法,關於awk的介紹可以參見

這個帖子。這道題是難點是如何寫匹配的正則表示式,關於Bash指令碼的正則表示式講解請參見這個貼子。那麼首先來看‘/.../'表示中間的是要匹配的正則表示式,然後脫字元^匹配一行的開頭,美元符$在正則表示式中匹配行尾,然後再看中間的部分,[0-9]{3}表示匹配三個數字,圓括號括起一組正則表示式. 它和"|"操作符或在用expr進行子字符串提取(substring extraction)一起使用很有用。那麼([0-9]{3}-|\([0-9]{3}\) )就可以理解了,它匹配了xxx-和(xxx) 這兩種形式的字串,然後後面的就好理解了,匹配xxx-xxxx這樣的字串,參見程式碼如下:

解法一:

awk
'/^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$/' file.txt

下面來看使用sed命令的解法,關於sed的講解可以參見這個帖子。那麼我們先來看後面的兩個引數,-n表示關閉預設輸出,預設將自動列印所有行,這樣就不會打印出不符合要求的數字串了。-r表示支援擴充套件正則+ ? () {} |。後面的正則表示式和上面都相同,就是後面多了一個p,在用sed時,p和-n合用,表示列印某一行,這樣才能把符合要求的行打印出來:

解法二:

sed -n -r '/^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$/p' file.txt

再來看使用grep命令的做法,關於grep的講解可以參見這個帖子。我沒有查到那個-P引數的用法,有沒有大神來點撥一下,後面的正則表示式思路根上面的相同,只不過用d{3}來表示[0-9]{3},道理都一樣,參見程式碼如下:

解法三:

1 grep -P '^(\d{3}-|\(\d{3}\) )\d{3}-\d{4}$' file.txt

參考資料: